农业知识图谱技术研究现状与展望

侯 琛1,2 牛培宇1

(1.中国农业大学信息与电气工程学院, 北京 100083;2.北京大学大数据分析与应用技术国家工程实验室, 北京 100871)

摘要:在当前农业信息化的发展进程中,多数农业子领域面临着数据资源分散、信息整合难度大、知识利用效率低等问题。作为近年来新兴的一种知识表示技术,知识图谱已在部分农业特定领域展现出了强大的语义推理和数据整合能力,同时帮助一些农业上层应用提高了性能。为系统总结近年来农业知识图谱构建与应用方面的研究成果,本文首先阐述了知识图谱基础和农业知识图谱的构建流程,并从本体建模、信息抽取、知识融合以及知识加工4方面总结了构建农业知识图谱所涉及的关键技术。将当前农业知识图谱的应用分为信息检索、问答系统、推荐系统、专家诊断系统和作物预测5方面,并对这些应用工作进行了梳理。最后,对当前农业知识图谱的研究现状进行了总结,并认为未来农业知识图谱可以从多模态知识推理、强时效性知识更新、多语言知识查询、跨领域数据融合以及子领域知识图谱构建等方面加以研究。

关键词:知识图谱; 农业领域; 信息检索; 问答系统; 推荐系统; 专家诊断系统; 作物预测

0 引言

随着农业大数据的发展,不同农业子领域的线上数据量呈指数级上升,多模态农业数据如图像、视频、文本等之间的知识互联也成为构建智慧农业数据平台的需要。现有农业领域的数据存储方法主要由专家凭借关系型数据库或自定义表格来记录信息,在面对不同方面的数据时往往需要多个数据库或表格进行关联,数据管理较为复杂,且难以实现多模态数据和跨领域数据的大规模互联。因此,农业信息化的发展迫切需要一个革新性的数据管理技术。

近年来随着信息技术的迭代更新,以图数据库为主要载体的知识图谱凭借强大的语义推理能力和可视化良好的知识表示方式逐渐引起各个行业的关注与研究。相比于传统的存储方式,知识图谱可以帮助整合农业跨子域、跨模态、跨数据源的异构数据,并挖掘知识间的隐性联系,从而显著提高农业信息的管理水平,具有巨大的发展潜力和广阔的应用前景。目前知识图谱在农业中的构建研究与上层应用已经有许多成果,而部分技术尚未研究,因此本文梳理近年来知识图谱技术在农业领域的研究成果,以期为农业知识图谱的研究与应用提供理论依据与技术参考。

为了对当前农业知识图谱方面的研究工作进行全面总结,本文以Web of Science、CNKI以及Google学术等作为文献检索数据库,以“农业知识图谱”、“知识图谱”、“Agricultural Knowledge Graph”等数十个中英文词汇作为检索关键词,搜集并筛选出自2012年知识图谱问世[1]以来国内外与农业知识图谱研究相关的98篇经典文献,以此作为本文综述的依据。

1 知识图谱基础

1.1 知识图谱基本概念

知识图谱是一种结构化表示知识的语义图模型,它具有良好的可视化能力,能将知识以图网络中的节点形式进行表示,并用连接不同节点的边来表示关系,其中节点表示实体或概念[2]。不同知识之间的直接联系在知识图谱中可以用边连接不同节点的形式进行表示,从而构成丰富的知识网络[3]。知识图谱最初可以追溯到20世纪60年代科学家构想的语义网络,之后随着Google知识图谱项目于2012年5月16日公布,知识图谱这一概念正式问世。该项目旨在作为辅助知识库帮助Google搜索引擎增强语义搜索功能,以提高用户体验[1,4]。此后知识图谱凭借丰富的语义网络和强大的知识表示能力,成为人工智能领域一个研究热点[5]。目前知识图谱已在智能问答[6]、用户个性化推荐[7]以及信息检索[8]等多个应用领域发挥重要作用。

知识图谱按照知识覆盖领域主要分为通用领域知识图谱和特定领域知识图谱[9]。通用领域知识图谱涉及知识的覆盖领域多且这些知识具有可开放性,然而往往为百科类知识,专业知识层面浅,例如Freebase[10]、Wikidata[11]、CN-DBpedia[12]以及Dbpedia[13]等。特定领域知识图谱则面向某个领域或行业的数据进行构建,知识层面比通用类知识图谱深,目前已经有一些面向特定领域的知识图谱如医学领域知识图谱DrugBank[14]、电影领域知识图谱IMDB[15]以及学术领域知识图谱AceMap[16]等,同时在农业中也有一些知识图谱的构建工作,如草莓知识图谱[17]、小麦品种知识图谱[18]等。

1.2 知识图谱的存储方式

知识图谱作为上层应用概念,其实际数据的存储方式主要有图数据库、关系型数据库等。关系型数据库如MySQL等一般以分库分表的形式存储不同知识之间的关系,然而随着知识规模的扩大,复杂繁琐的数据存储模型使得维护存储知识的难度增大,同时相比于图数据库显著降低了知识关系的可读性;而图数据库是专门针对知识图谱设计的数据存储与表示技术[19],它是一个由节点和有向关系边构成的属性图模型,可以通过RDF(Resource description framework)三元组来存储与表示知识和关系,从而可以直观地反映真实世界的数据联系[20]。RDF三元组表示为

R=〈e1,r,e2

式中 R——三元组

e1e2——主语和宾语

r——e1e2的谓语

在知识图谱中主要有〈实体,关系,实体〉和〈实体,属性,属性值〉2类三元组,而选取哪一种三元组来构建知识图谱取决于本体模型的设计。例如,“〈水稻,英文名,Rice〉”和“〈水稻〉实体有属性(英文名: Rice)”均在农业领域知识图谱中表示了“水稻的英文名是Rice”这一知识关系,前者为两个实体节点,即〈水稻〉和〈Rice〉,中间为有向关系“英文名”进行连接这两个节点;后者则是一个实体节点〈水稻〉,在这一节点中有实体属性和对应的属性值,即“英文名”为实体属性,“Rice”为对应的属性值。

由于具有良好的可视化特性和易扩展特性,图数据库已经成为知识图谱主流的存储方式。常见的图数据库有Neo4j[21]、JanusGraph[22]以及ArangoDB[23]等,其中有着原生图引擎的Neo4j图数据库具有开源性、高性能以及使用简单等特点,是目前使用率最高的图数据库。在农业领域中,多数知识图谱的构建也选取了Neo4j作为图谱存储的载体。例如,姜丽华等[24]采用Neo4j图数据库存储和表示抽取到的结构化三元组,实现了水产病害知识图谱构建与可视化应用。吴赛赛等[25]利用深度学习技术抽取领域知识,并利用Neo4j构建了作物病虫害知识图谱。

2 知识图谱构建方法

2.1 流程构建

知识图谱构建流程主要为两种,分别是自底向上构建法和自顶向下构建法[26-27]。图1为知识图谱的两种构建技术流程。自底向上方法是从大量的数据文本中提取实体,并把相似的实体归为一类,之后根据一些实体之间的联系抽象出关系和概念,将置信度高的实体和关系结构化导入数据库,构成知识图谱[28]。该方法常见于通用学科领域,多采用神经网络方法或模型与规则结合的方法对实体进行归类,涉及实体类别的定义较为宽泛[29],而在农业领域也对这一方法进行了应用探索。CHEN等[30]采用自底向上方法构建了农业知识图谱,并通过深度学习技术实现了自动从农业文本识别出实体并更新到知识图谱的功能;张博凯等[31]通过对农技问答数据进行采集与预处理,并将得到的三元组存入Neo4j图数据库,成功构建出了一个应用性较好的农技知识图谱。然而,由于涉及实体类别复杂多样且图谱构建的评价标准尚不统一,目前采用自底向上方法构建高质量的农业知识图谱仍然是一个挑战。

图1 知识图谱构建流程图

Fig.1 Construction of knowledge graph

自顶向下方法则常用于领域知识图谱的构建[32],该方法首先需要根据将要存储的知识对象来定义实体、概念和关系,从而得到构建知识图谱所依据的本体模型,之后根据本体模型对知识进行划分,存储到数据库形成知识图谱。陈明等[33]为提高花卉病虫害知识的管理水平,提出利用RDF存储构建的本体模型,并通过RDF与属性图的映射关系抽取三元组,从而成功构建了一个花卉病虫害知识图谱。刘明鹏等[34]采用专家知识建模构建了涵盖造林树种的7类概念和12种属性,之后构建了造林树种本体模型,并依据造林树种本体模型实现了造林树种知识图谱的构建与可视化应用。但由于需要在没有明确标准指示下定义知识本体模型的实体和关系,构建人员本身的知识差距会影响本体模型的质量,即使是领域专家在制定规则时也面临很多困难的决定。

在农业知识图谱构建方面,一些特定领域的数据存在异构、多源以及数据类型复杂等问题,若仅采用自顶向下法,由专家知识建模得到的模式层很难完全覆盖所有的实体、概念和属性,并且人工构建的知识分类也不可避免地存在一定的概念偏差。同样地,自底向上法的知识聚类与分类所得到的模式层难以层次清晰,构建质量也较低。于是近年来出现了一些自顶向下法和自底向上法相结合的知识图谱构建方法,即首先采用自顶向下法中的专家知识建模构建出基本的模式层,然后根据自底向上法挖掘得到的聚类知识来更新模式层并填充实体,最终构建出一个较为完备的领域知识图谱[35]。例如,赵明等[36]提出在面向植物领域知识图谱的本体构建中采用人工指导的知识抽取方法来获取植物领域的概念、分类和非分类关系,提高了植物领域本体概念的抽取效果。赵继春等[37]提出在对农业在线学习资源数据的实体关系抽取和标签生成中进行人工矫正,实现了农业在线学习资源知识图谱的高质量构建与推荐应用。

2.2 农业知识图谱构建技术

知识图谱在农业中的构建流程涉及一些关键的构建技术,主要包括:本体建模、信息抽取、知识融合和知识加工。因此对这4种构建技术进行综合评述,并总结每种知识图谱构建技术在农业中的应用特点(表1),为未来农业知识图谱构建提供参考。

表1 农业知识图谱构建技术应用特点

Tab.1 Application characteristics of agricultural knowledge graph construction technologies

构建技术分类常见方法特征优点应用局限性农业相关成果手动构建TOVE、骨架法、IDEF、METHONTOL-OGY领域专家人工构建构建层次清晰可靠性强构建主观因素多,且难以覆盖所有领域本体CCS本体模型[40]、OntoAgroHidro[41]、农业操作技术本体[42]本体建模半自动构建七步法、五步循环法、循环获取法[43]基于规则或标准,结合自动和人工构建步骤构建完备,较为可靠需要人工成本,步骤繁琐且不固定小麦生产本体[44]、作物虫害本体[45]自动构建深度学习[46]、机器学习[47]由计算机自动构建本体实现成本低,构建快速提高构建质量难,可靠性差农业文献本体[48]、农业子域本体[49]实体抽取基于传统规则、基于机器学习、BERT、BILSTM[52]对序列标注文本进行命名实体识别模型容易拟合,识别效果好识别效果受语料标注质量影响,且未考虑实体间的语义关系RENT算法[50]、农作物病虫害及农药实体[51]、农作物病虫害[53]、农作物品种等4类实体[54]、猕猴桃种植[55]、苹果病虫害[56]信息抽取关系抽取基于规则、机器学习识别实体间的语义关系并连接灵活度高,可以采用独立的数据集学习语义关系未考虑实体抽取的精度影响,存在误差积累和关系冗余等问题农作物病害治愈和预防关系[57]、RelExOnt[58]实体关系联合抽取机器学习、深度学习同一模型,同时进行实体识别和关系连接降低错误传播影响,实体和关系存在表征交互模型复杂,实现难度大,标注数据困难,存在实体关系重叠问题家禽疾病诊疗关系[59]、BERTBILSTMLSTM[60]、BERTCRF[61]知识融合本体匹配基于规则或框架不同知识库的本体进行匹配与融合提高了本体库质量和规模人工成本高,缺少自动匹配方法农业本体匹配框架[62]、农业生产与食品加工本体融合[63]、农业网络信息融合[64]实体链接图模型[65]、深度学习模型[66]采用共指消解和实体消歧来识别歧义实体[67]消除了实体关系表述的一词多义和多词一义的情况在农业知识融合技术中应用较少知识加工知识推理/补全基于规则、Trans系列模型[72]、图神经网络在已有的知识与关系中发现新的知识联系丰富知识图谱的语义关系,提高知识图谱的构建质量推理的知识受限于农业多变环境、专家对知识原始的采集与处理农产品冷链推理[68]、番茄病害诊断推理[69]、农机知识推理[70]、果树病虫害诊断[71]、农产品管理[73]、作物产量预测[74]质量评估抽样检测、基于外部知识的对比评估[75]、框架评估[76]评估知识图谱质量帮助发现知识图谱构建的不足在农业领域中尚未有代表性研究

2.2.1 本体建模

本体建模技术对农业领域知识图谱的实例构建有指导作用,并且一个好的本体模型可以使知识图谱的实体、关系和概念的层次更加分明,构建质量更高[38]。本体表示对聚类知识抽象出的概念的一个规范描述,即“本体是共享概念化的正式、明确的规范”[39]。本体强调一个领域内的基本概念和概念之间的关系,而实体则是本体实例化,表示具体某个事物。在概念上,本体和实体的关系一定程度类似于面向对象编程中的类与对象的关系。此外,由于存在人工建模主观因素多、自动构建质量低等问题,本体构建方法尚未形成统一标准。

农业本体建模方法可分为手动构建、半自动构建以及自动构建。手动构建即专家对丰富的特定领域知识进行梳理,抽象出概念、本体和关系,从而构建出一个本体模型,常见的方法有多伦多虚拟企业法(Toronto virtual enterprise, TOVE)、骨架法、集成化定义法(Integrated definition, IDEF)以及METHONTOLOGY法。在知识图谱应用于农业的早期,LI等[40]提出一种结合领域本体和任务本体的作物知识表示方法,手动构建了基于农作物种植标准(Crop cultivation standard, CCS)的本体模型,并以辣椒为例展示了该方法的应用性和有效性。随后,BONACIN等[41]提出利用Protégé本体编辑工具对特定领域专家与最终用户群体提供的概念和本体进行人工建模,实现了一个关于农业活动和气候变化对水资源影响的知识本体模型OntoAgroHidro。ABRAHO等[42]提出一种将农业现场操作的技术知识表示为任务本体的方法并手动构建了本体模型,同时以甘蔗收获作业为应用验证了该方法的有效性。在农业中,手动构建方法下的本体模型层次分明,可复用性强,但也存在着本体完备性受限、主观因素多等问题。

农业半自动构建方法一般结合现有本体库或农业叙词表进行领域本体建模,方法多样并不固定,既可以先手动构建基本的本体概念再结合知识抽取进行完善,也可以先通过自动知识抽取方法构建本体层再进行人工调整。常见的半自动方法有七步法、五步循环法和循环获取法[43]。在农业方面,AHSAN等[44]提出采用七步法构建小麦生产本体模型,即先通过工具自动收集小麦生产知识并构建初始本体层次,之后由专家人工完善这些本体,最终构建出了完备的小麦生产本体模型并验证了有效性。随后,CHOUGULE等[45]提出一种作物虫害本体半自动构建方法,即首先由专家手动提供虫害文本,之后通过关键词提取算法对这些文本进行本体提取,从而实现了一个作物虫害本体管理平台的构建与应用。整体而言,目前农业本体半自动构建技术应用较多且效果稳定,但在未来趋势中本体建模技术将持续向成本更低、智能水平更高的自动构建技术方向发展。

农业本体自动构建法是指计算机结合深度学习[46]或机器学习[47]技术自动对农业领域文本进行本体抽取和建模。该方法构建成本低、速度快,但实现困难,在农业中的应用仍处于探索阶段。王超等[48]结合信息抽取技术和概念的关联分析与K均值(K-means)聚类算法提出一种基于农业文献的本体自动构建方法,实现了农业领域概念间关系聚类和本体构建。DEEPA等[49]结合文本相似性与朴素贝叶斯模型(Naive Bayesian model, NBM)提出一种面向天气、害虫、土壤等农业子域本体的自动构建方法,相比于决策树(Decision tree, DT)和K近邻(K-nearest neighbors, KNN)分类算法,提高了农业本体构建的精度。目前本体自动构建技术在构建质量方面仍存在较大提升空间,未来还需要进一步深入探索。

2.2.2 信息抽取

为提高对领域知识结构化管理的水平,知识图谱构建技术需要从多源异构的领域文本中进行信息抽取(Information extraction, IE)。信息抽取技术包括实体抽取、关系抽取以及属性抽取。实体抽取即是对文本进行命名实体识别(Named entity recognition, NER)。在农业文本NER任务应用的初期,CHATTERJEE等[50]结合正则表达式和自然语言处理(Natural language processing, NLP)技术提出了RENT算法,实现了农业实体自动抽取。李想等[51]利用CRF模型对农作物、病虫害及农药命名实体进行识别,提高了实体识别准确度。然而,由于基于传统规则的方法人力成本消耗大且规则泛化性小,基于传统机器学习的方法需要构造特征并考虑误差传播问题[52],农业文本的NER任务已逐渐转向研究基于深度学习的方法,并且近年来已有较多研究成果。例如,李林等[53]于2021年结合BERT(Bidirectional encoder representation from Transformers)、双向长短时记忆网络(Bi-directional long short-term memory, BILSTM)、条件随机场(Conditional random fields, CRF)以及多源融合信息技术提出一种中文农作物病虫害NER模型,该模型使得识别病虫害、药剂和作物等实体的F1值得到了提高;针对当前NER任务存在捕获长距离依赖信息不充足等因素导致识别效果不理想的问题,韦紫君等[54]于2022年提出一种基于EmBERT-BILSTM-CRF的农业文本NER方法,相比其他模型,提高了农作物品种、病害、虫害和农药4类农业实体的识别准确率;李书琴等[55]针对猕猴桃种植领域文本实体识别难度大的问题,提出利用BERT、双向门控循环网络(Bi-directional gated recurrent unit, BiGRU)和CRF进行字词信息融合,最终在公开数据集上使得模型识别的精确率得到了提高;随后,蒲攀等[56]于2023年结合Transformer、BILSTM和CRF提出一种NER模型,提高了苹果病虫害文本识别的F1值。综合当前工作来看,深度学习方法在农业文本NER任务中已经成为一个研究热点。

关系抽取则是将抽取后的实体进行关系连接,并构建结构化三元组进行表示,主要分为关系单独抽取和实体关系联合抽取两类。此外,属性抽取任务通过序列标注任务也可以转换为关系抽取的一种。目前基于规则和传统机器学习两类方法在农业关系单独抽取任务中均有一些工作。SRINIVASAN等[57]结合同义词库和多项式NBM分类器提出一种农业文本语义关系提取方法,提高了作物病害文本的“治愈”和“预防”两种关系的提取效果。KAUSHIK等[58]在基于NLP技术的RENT算法工作上进一步拓展,提出一种基于规则的推理算法RelExOnt,使得农业文本关系抽取的精度得到提高。而农业实体关系联合抽取任务则以深度学习技术为主。胡滨等[59]针对现有标注策略难以解决关系重叠等问题,提出了一种基于BERT和双重指针标注的家禽疾病诊疗文本实体关系联合抽取模型JEERPD,相比于现有方法,该方法准确率、召回率和F1值均得到提高。QIAO等[60]在LSTM-LSTM-Bias联合抽取模型引入BERT模型,提出了BERT-BILSTM-LSTM模型,并且实验以农业数据集AgriRelation为例,验证了该模型在农业文本实体关系联合抽取任务中的有效性。李书琴等[61]针对实体关系重叠的问题,结合词汇信息嵌入和BERT-CRF提出一种用于玉米育种文本的实体关系联合抽取模型,使得抽取的精确率、召回率和F1值均得到了提升。农业文本联合抽取任务采用同一模型对实体和关系同时进行表征提取,可以有效解决因先识别实体后提取关系而导致的错误传播等问题,然而模型结构复杂、表征统一学习容易混乱以及文本标注困难等局限也使得农业文本联合抽取任务实现难度更大。图2为关系抽取产生错误传播问题的示例。

图2 关系抽取的错误传播问题示例

Fig.2 Example of error propagation problem in relation extraction

2.2.3 知识融合

知识融合是将不同来源之间的知识在同一框架下进行对齐与融合,使得领域知识图谱的数据规模和质量均得到提升。在对不同来源的农业文本进行知识抽取之后,构建环节所得到的知识存在质量参差不齐、实体关系冗余等问题,因此需要农业知识融合技术进一步整合这些多源知识。

农业知识融合技术主要分为本体匹配和实体链接2部分。农业本体匹配是指将农业领域内的不同知识库之间的本体进行匹配和融合,从而使得最终知识图谱构建所依据的本体更加完备,并且近年来已有一些工作。XIE[62]针对农业领域中隐性知识发现困难等问题提出一种基于规则的农业本体匹配与融合框架,不仅包括农业知识的抽取、清理以及标注模块,而且包括农业本体匹配、融合规则构建、选择以及评价模块,并通过案例证明了该框架的有效性。MULJARTO等[63]基于农业生产实验本体和食品加工实验本体的融合方法,开发了一种跨互补子域的本体网络,并通过葡萄栽培实践和酿酒产品操作的应用案例验证了这一本体网络的可行性。此外,LI等[64]针对农业互联网信息的异质性和表征提取难等问题,提出一种基于本体匹配的农业网络信息融合方法,提高了农业物联网信息处理效率。综合目前农业本体匹配工作,多数需要制定融合框架,有着较高的人工成本,因此未来基于不同知识库间本体映射的自动技术方法将成为一个研究方向。

农业实体链接技术包括共指消解和实体消歧2部分,共指消解是指识别并消除指向同一实体的不同表述,即多词一义的情况,而实体消歧是指识别并消除当同一词汇在不同场景下的含义存在差异时,实体关系表述会出现歧义,即一词多义的情况[65]。例如“苹果”实体在农业文本中表述为一种水果,而在手机品牌文本中表述为一种手机品牌,若在知识图谱中用同一个“苹果”实体进行表示则会出现歧义。在通用领域,刘峤等[66]针对共现实体间的语义相关性未被考虑等问题提出一种基于图的集成实体链接方法,实现了对同一文本中多个歧义实体的批量实体链接;谢世超等[67]针对文本一词多义、多词一义等问题提出一种基于BERT的实体链接方法STELM,分别将每一对指称上下文和候选实体输入到BERT,进而从全连接层的输出中选择分数最高的候选实体作为链接对象,提高了实体链接的准确率。由此可见,实体链接方法在解决实体歧义问题方面发挥着重要作用。值得注意的是,这一方法尚未在农业领域得到广泛应用,为未来的研究提供了潜在的机会和研究方向。

2.2.4 知识加工

在融合多源知识后,一些未发现的知识联系并不能在知识图谱中进行表示,因此为进一步丰富和扩充知识图谱,需要对知识进行加工。知识加工环节包括知识推理、知识补全和质量评估,即利用知识推理技术在已经存在的实体和关系中进行推理,从而发现新的实体关系,并对知识图谱进行补全,最后对知识图谱构建质量进行综合评估。

知识推理作为知识补全的关键技术,在农业领域已经有一些基于规则的应用。牟向伟等[68]为提高农产品冷链物流安全监控管理的效率,提出一种基于描述逻辑规则SROIQ(D)的知识语义模型,实现了农产品冷链HACCP知识的建模与推理。LIU等[69]结合模糊规则和知识树提出一种用于番茄病害诊断的知识表示与推理模型,使得专家诊断系统的准确率得到了提高。LI等[70]结合图像处理技术和知识推理规则框架在新型农机设计系统中实现了农机知识的推理与应用。目前,基于规则的方法虽然可解释性强,但受限于规则制定的质量且没有训练数据,难以进行农业知识图谱的语义推理。为进一步提高农业知识的推理能力,GUAN等[71]针对果树病虫害诊断提出了一种基于翻译模型TransR的推理方法,并将该方法运用到所构建的农业知识图谱中,使得诊断的准确率得到了提高。基于分布式特征表示的Trans系列嵌入模型[72]相比于基于规则的方法在稀疏农业知识图谱上具有更好的推理能力,然而在多跳关系的推理环节中仍然表现欠佳。于是近年来,基于神经网络模型的知识推理方法开始被引入到农业应用中。为考虑多种农产品的潜在关系,YAN等[73]利用图神经网络(Graph neural network, GNN)提出一种基于深度数据分析与推理的农产品管理方法,并通过实验结果验证了该方法具有更好的性能和较强的鲁棒性。FAN等[74]提出一种基于GNN-RNN的作物产量预测方法,通过在模型中加入地理和时间知识之间的语义关系推理,使得产量预测准确率得到提高。尽管知识推理与补全方法逐渐在农业领域中应用,但推理的知识仍然受限于农业中多变的气候环境影响和专家对原始知识数据的采集与处理,因此,在将这些方法应用于实践之前,需要更深入地考虑和解决这些难题,以确保知识推理的准确性和可靠性。

质量评估是知识图谱构建技术的一项重要环节,可以帮助判断知识图谱的质量。常见的评估方法有抽样检测法、框架评估法和基于外源知识库的对比法[75],其中抽样检测法为专家从知识图谱中抽出知识样本进行评价,该方法准确率高,实现简单,但评估效果受限于抽检率和人工成本。框架评估法需要针对领域知识制定质量评估函数,而框架本身制定的质量将直接影响最终的评估效果[76]。基于外部知识库的对比法则需要找到高度相似的外部知识库与目标知识图谱进行对比。该方法大大减少人工成本,并提高图谱中知识的评估率,然而在知识图谱技术尚未广泛应用的农业领域中,寻求同领域高度契合的外部知识库并非易事,因此在选择质量评估方法时需要综合考虑特定领域的需求和背景。

3 农业知识图谱应用现状

作为人工智能应用的一个研究热点,知识图谱已经为许多领域和行业的信息推荐、知识问答以及信息检索等上层应用提供了数据支撑,同时近年来在农业中的应用也有许多代表性成果。因此,对当前农业知识图谱的上层应用进行全面总结,分别从信息检索、问答系统、推荐系统、专家诊断系统以及作物预测5方面进行综合评述。

3.1 信息检索

作为知识图谱最基本的上层应用,信息检索一般利用图数据库结构化查询语句对知识图谱节点关系进行目标检索的方式来实现。在农业领域,信息检索可以帮助农业从业者高效获取有关作物管理、气象条件以及育种技术等知识,同时为农业生产决策支持、病虫害监测、农产品市场行情分析、农业文献获取以及农业培训与政策咨询等方面提高良好的功能支撑,从而提高农业生产的质量和效率。

在应用初期,传统检索方式因以字符串匹配为主导致检索准确率低的问题愈发明显。针对这一问题,李贯峰等[77]于2017年结合语义相似度计算和推理规则提出了一种基于枸杞病虫害本体的查询与检索模型。该模型查准率和查全率分别达到72.29%和33.40%,相比传统检索方法,两种指标均得到了提高,然而从实验数值上看,未来还有一定的提升空间。

随着农业信息检索的发展,在现有的农业数据库中,一些同质异构、知识歧义、信息集成不全面等检索问题会高频出现。为解决这些问题,SUN等[78]于2019年提出了一种基于农产品生产与经营知识图谱的信息检索框架,该框架下的知识图谱涵盖了“种植—养殖—加工—质检—仓储—运输—销售”的基本流程,有效提高了农业信息平台的信息整合和利用能力;张海瑜等[79]于2021年采用自顶向下方法构建了围绕农作物、病虫害以及品种等知识方面的农业知识图谱,并结合这一知识图谱提出了一种农业知识信息检索方法。该方法采用词频-逆文本频率指数(Term frequency-inverse document frequency, TF-IDF)关键词提取算法将用户输入的文本转换为Neo4j图数据库查询语句,并结合前后端设计实现了一个可视化较好的农业信息检索系统。此外,相比于新兴的深度学习方法,传统检索方式会忽略信息间的内在联系,使得检索结果的质量较低。针对这一问题,张贤坤等[80]结合知识图谱和BERT模型,于2021年提出了一种食品安全案例检索方法,并通过“三聚氰胺”、“二氧化硫”等多种事件检索的实验结果验证了该方法对提高检索质量的有效性。

3.2 问答系统

作为数字农业的一部分,问答系统对促进智慧农业的发展和农业领域的数字转型有重要意义,并且为农业领域知识传播和技术推广提供了便利。相比于信息检索,问答系统进一步降低了用户的使用门槛,只需要输入自然语言便能够自动匹配最佳结果,提高了用户体验。近年来,随着技术的不断发展与应用,知识图谱凭借其强大的语义推理能力,在农业领域问答系统中发挥着关键作用。它通过为农业工作者提供更为个性化的建议和实时问题解答,显著提升了农业信息查询的效率和质量。

目前,基于农业知识图谱的问答功能主要依赖于用户问句分类模型和将问句转化为结构化查询语句的方法来实现。例如,郑泳智等[81]于2021年提出了一种基于荔枝和龙眼病虫害知识图谱的知识问答方法,通过构建文本分类模型来进行问句意图识别,并基于模板匹配规则将问句转换为Neo4j结构化查询语句,实现了良好的问答功能。然而,该方法的问答效果局限于从用户问句识别出的命名实体的边界完整度和匹配规则制定的准确性,因此还有一定的改进空间。随后,对于传统问答方式仅进行信息匹配导致问答效果不佳的问题,农业问答领域涌现出了多种解决方案。杨硕等[82]于2023年提出了一种基于多模态知识图谱的问答对选择模型,该模型通过结合ComplEx图谱嵌入模型和注意力感知方法实现了多模态数据与问答对的语义信息融合,并以葡萄种植为例验证了该模型对提高答案选择能力的有效性;而刘明鹏等[34]则提出采用基于模板匹配的方法在构建的造林树种知识图谱上搭建知识问答应用,该应用通过高质量的模板库和匹配规则,为林业工作者提供了可视化良好的知识服务。此外,传统问答方式的答案选择结果还会出现大量的冗余数据。针对这一问题,杨喆等[83]提出一种利用知识图谱来实现羊群疾病知识问答的方法,该方法通过BERT模型进行相似度计算以实现属性与问句的映射,从而减少了冗余数据,并提高了羊群疾病问题识别的F1值。

综合以上研究,知识图谱为近年来的农业智能问答应用提供了优秀的知识推理和检索功能。未来随着越来越多的农业领域引入知识图谱,农业问答系统将具有更大的发展潜力和研究价值。

3.3 推荐系统

农业推荐系统可以根据用户的访问记录、cookies和偏好设置等信息为其提供个性化的推荐服务,从而方便用户学习更多与目标信息相关的农业技术和知识,而将知识图谱作为农业信息推荐的辅助信息,可以减少不必要的冗余推荐,提高推荐结果的精准度。

最初基于农业知识图谱的推荐应用主要依赖于对用户查询信息进行结果反馈的方式实现。例如,HAUSSMANN等[84]针对缺乏跨领域的食物知识图谱等问题,于2019年提出了一种可用于构建统一食品知识图谱的软件工具,并在食品知识图谱上实现了面向消费者健康饮食的信息推荐;JIN等[85]针对农业机器人专利信息和数据资源的利用效率不高的问题,于2021年提出了一种基于知识图谱的农业机器人设计推荐方法。该方法结合自适应设计流程和词共现网络(Word co-occurrence network, WCONet)构建农业机器人技术知识图谱,并以柑橘采摘机器人设计为推荐案例,验证了推荐结果对实际机器人设计的可行性。

随着农业信息推荐的发展,更具使用体验的个性化推荐服务逐渐被研究应用。然而,由于个性化推荐需要大量的用户数据作为推荐运算的基础,并且快速获取这些数据对于初步应用的农业推荐系统而言较为困难,因此,农业推荐系统常常面临着因数据稀疏和冷启动导致推荐精度低的问题。针对这一问题,XIE等[86]于2022年提出了一种结合注意力因子分解机(Attentional factorization machine, AFM)和知识图谱的农产品推荐方法。该方法以自顶向下构建的知识图谱作为推荐算法的辅助信息,通过多层感知机(Multi-layer perception, MLP)对农产品特征向量和用户嵌入向量进行融合,之后利用向量的内积运算输出用户点击率的预测结果,相比于其他方法提高了预测的准确度和受试者工作特征曲线下面积(Area under curve, AUC)。随后,ZOU等[87]为促进玉米新品种在适宜种植地的精准推广,于2023年提出了一种基于知识图谱的玉米品种适宜种植面积推荐方法。该方法将构建的玉米生态区气象知识图谱作为推荐数据,并利用RippleNet推荐模型计算玉米品种适宜度在不同气象环境下的空间关联度,从而提高了推荐准确率。

目前农业许多子领域尚未有良好的信息传播技术应用,而推荐系统或能帮助一部分农业技术领域完成数字化转型,通过更便捷的方式为农业建设者提供领域信息,从而提高农事活动的效益。例如,戈为溪等[88]针对当前水稻施肥因存在盲目性导致资源浪费的问题,提出了一种基于知识图谱和案例推理的水稻施肥推荐方法。该方法将图谱中的实体关系转化为低维向量,并从中推理出k个相似案例进行组合预测,从而提高了不同肥料施肥预测精度。

3.4 专家诊断系统

近年来,知识图谱技术逐渐在农业、畜牧业等领域的专家模拟诊断中得到研究和应用,多采用辅助诊断模型发现动植物病害知识的隐性关系以提高诊断的准确率。2021年,YU等[89]针对水稻病虫害信息分散、专家诊断可解释性弱等问题,提出采用BILSTM-CRF模型对水稻病虫害文本进行知识抽取,之后利用自顶向下方法构建知识图谱,并结合确定性因子(Certainty factor, CF)实现了水稻病虫害的智能诊断应用,最后以准确率为指标,通过实验案例说明了该诊断方法具有较好的性能;GUAN等[71]为提高文本中果树病虫害的预测效果,提出利用知识表示学习方法对用户文本进行特征实体向量的提取,并将构建的农业知识图谱作为辅助,结合集成的深度学习模型实现了果树病虫害图像与文本的诊断,相比于其他模型提高了诊断精确率、召回率和F1值。

然而,不同的农业实践、作物类型以及地理环境要求专家诊断系统具有较强的通用性和鲁棒性,这对于当前难以获取大量农业数据的诊断系统来说是一个挑战。针对这一难题,翟增林等[90]于2022年提出一种基于深度学习和知识图谱的羊病诊断方法。该方法分别利用BILSTM和LSTM提取症状字特征和由图卷积网络(Graph convolution network, GCN)编码后症状词与羊病知识图谱的融合特征,并将两部分特征进行拼接和SoftMax分类得到诊断结果,提高了诊断准确率和召回率。随后,WANG等[91]针对奶牛疾病诊断方法准确率低等问题,于2023年提出一种基于知识图谱的奶牛疾病诊断方法。该方法利用构建的奶牛疾病知识图谱来辅助提取隐式特征,之后将隐式特征和显式特征一起输入到BILSTM-CNN网络,使得奶牛疾病诊断的F1值得到提高;郑增威等[92]针对葡萄园病虫害实体隐性关系难以提取等问题,提出利用图注意力网络(Graph attention network, GAT)映射属性特征知识图谱和视觉编码器(Vision Transformer, ViT)提取图像表征信息,以辅助诊断模型关联病害间的特征信息,从而提高了诊断准确率和F1值。

此外,对于农业中一些资源受限的子领域,如何建立和维护专家诊断系统仍然需要逐步深入探索。徐畅等[93]针对作物病虫害信息获取难、诊断技术实现成本高等问题,提出通过构建作物病虫害知识图谱来存储植物电子病历中的丰富数据,并结合BERT和卷积神经网络(Convolutional neural network, CNN)实现了作物病虫害非结构化文本的特征抽取和模拟专家诊断,最终通过实验对比多种病虫害诊断的准确率表现验证了该方法的有效性。

3.5 作物预测

目前,知识图谱在预测模型中的应用常见于医学疾病、工业产量等预测领域,而在农业领域中的应用相对滞后。在农业中,知识图谱可以辅助预测系统整合温湿度、光照、土壤元素以及病虫害等历史信息来预测作物生长趋势、产量和质量,从而为农业工作者调整作物环境和管理市场供应提供参照,这对提高农业生产效率、降低风险和优化资源利用有重要作用。

在农业应用初期,一些传统的预测模型难以发现作物病虫害、动物疾病之间的语义关系,导致出现预测准确率较低、预测难度大等问题。针对这些问题,张善文等[94]于2020年提出了一种结合知识图谱和BILSTM的小麦锈病预测方法。该方法将构建的小麦锈病知识图谱中的三元组转化为特征向量,并输入到BILSTM进行训练以实现预测模型,相比于其他方法提高了预测的准确精度。随后,为帮助提高作物生产力,CHOUDHARY等[95]则是结合知识图谱和机器学习模型提出了一种作物产量预测框架。该框架通过构建作物知识图谱,并将10种机器学习模型在Rabi 和 Kharif两种数据集上的评估预测效果进行对比,以选取性能最佳的模型作为应用,最终验证了该框架的有效性。

随着农业预测需求的增加,一些跨子领域的预测任务常常难以进行,例如将复杂多变的气象灾害作为预测农田作物生长状况的因素之一,则需要将多模态、跨领域、异构的时序数据进行集成,而这种集成技术尚处于探索阶段,并不成熟。针对这一难点,一些学者提出利用知识图谱的语义推理技术来实现异构时序数据的集成。ZHANG等[96]针对缺乏对农业气象灾害异构数据的集成技术等问题,于2023年提出构建融合遥感数据、气象数据等多种异构数据的时空知识图谱,并将专家知识形式化为一种推理规则,实现了农作物的灾害监测、预警和分析;SHI等[97]针对食品安全风险信息集成难、预测难度大等问题,提出根据建立的食品安全指标体系构建时序知识图谱,并利用历史信息、全局信息等学习方法集成的时序知识图网络实现风险预测模型,从而提高了模型预测准确率和平均倒数排名(Mean reciprocal rank, MRR)。

3.6 上层应用现状

为更清晰地说明近年来知识图谱在农业中的上层应用,系统总结了国内外文献中的应用特点,如表2所示。

表2 知识图谱在农业中的上层应用汇总

Tab.2 Summary of upper-level applications of knowledge graphs in agriculture

分类文献发表时间方法/模型主要特点图谱数据来源实验指标与结果枸杞病虫害检索2017[77]基于规则采用基于本体的规则推理方法和语义相似度计算实现信息检索枸杞农业网站准确率达到72.29%,召回率达到33.40%农产品生产经营检索2019[78]基于框架利用集成框架实现农产品生产经营知识图谱的平台检索农业数据库、绿色云平台通过两种检索案例验证了检索的有效性与准确性信息检索 农业知识检索2021[79]BILSTMCRF、LSTM、TFIDF利用BILSTMCRF进行实体识别、LSTM进行文本分类、TFIDF提取关键词以实现图谱知识检索农业数据库、百度百科、农业信息等网站准确率, 召回率, F1值:品种类为90.13%、91.11%、90.62%,病虫害类为89.24%、88.12%、88.68%,防治类为88.63%、89.15%、88.89%食品安全案例检索2021[80]欧氏距离相似度方法、BERT利用BERT对食品安全案例特征进行向量化,并采用欧氏距离计算案例相似度以实现图谱案例检索食品安全类网站、曝光食品安全新闻事件实验中与目标案例越相似的案例排名越靠前荔枝龙眼病虫害问答2021[81]BERTBILSTMCRF、BERTRNN利用BERTBILSTMCRF进行实体识别,并利用BERTRNN完成意图分类以实现图谱问答广州农科院、维基百科、百度百科实体识别:准确率为86.26%,召回率为88.28%,F1值为87.26%;意图分类:准确率为96.51%,召回率为93.19%,F1值为93.94%问答系统葡萄种植问答2023[82]ComplEx、CNN、BILSTM利用ComplEx获取图谱特征表示,并设计多模态知识图谱以用于增强答案选择葡萄种植网站、书籍平均精度均值达到84.21%,平均倒数排名达到85.02%造林树种问答2023[34]基于模板匹配根据本体构建知识图谱,并基于模板匹配实现造林树种知识图谱的知识问答林业信息网、植物志、百度百科等网站理解用户问题并回答正确准确率达到94%羊群疾病问答2023[83]BILSTMAttentionCRF、BERTSoft-Max利用BILSTMAttentionCRF进行实体识别,并结合BERTSoftMax实现羊群疾病知识图谱上的问答设计羊群疾病网站、知网CNKI文献、CCL2021数据问答模块F1值达到85.24%食品推荐2019[84]基于程序和框架提出一种用于创建统一食品知识图谱的软件工具包美国农业部、网络食谱资源整体F1值达到95.5%农业机器人设计推荐2021[85]TFIDF、WCONet结合自适应设计流程和WCO-Net构建农业机器人技术知识图谱以用于设计推荐Web of Science数据库根据案例推荐设计的柑橘采摘机器人功能良好推荐系统农产品推荐2022[86]AFM、MLP利用AFM进行图谱关联信息聚合,并利用MLP整合用户与图谱的特征向量以进行预测农产品电商平台精确率:75.8%AUC:61.9%玉米种植面积推荐2023[87]RippleNet利用RippleNet模型实现生态区气象知识图谱上的玉米品种适宜种植面积推荐国家气象信息中心、黄淮海生态区精确率达到76.3%水稻施肥推荐2023[88]PairRE利用PairRE模型将知识图谱实体关系映射为低维向量后对施肥方案的缺失信息进行推理中国国家水稻数据中心准确率:92.85%(氮肥),82.61%(磷肥),79.17%(钾肥)

续表2

分类文献发表时间方法/模型主要特点图谱数据来源实验指标与结果水稻病虫害诊断2020[89]BILSTMCRF结合确定性因子实现水稻病虫害知识图谱上的智能诊断水稻病虫害网络文献精确率达到86.25%果树病虫害诊断2021[71]TransR、CNNDNNBILSTM利用表示学习和双通道神经网络实现知识图谱上的果树病虫害文本与图像诊断农业百科网站AppleRingRot数据集实验结果:准确率为88%,召回率为92%,F1值为90%羊病诊断2022[90]GCN、LSTM利用GCN聚合知识图谱与症状文本特征,并结合LSTM学习单字特征以实现模型诊断羊养殖百科、论坛等网站准确率为94.29%,召回率为88.26%专家诊断系统奶牛疾病诊断2023[91]BILSTMCNN将诊断报告的显式特征和从知识图谱中提取的隐式特征输入到BILSTMCNN中实现诊断东北农业大学奶牛疾病知识图谱F1值达到94.89%葡萄园病害诊断2023[92]GAT、ViT利用GAT映射知识图谱的属性特征和ViT提取图像表征信息以辅助诊断农业网站、昆虫科学网站、维基百科等GP21数据集:精确率为91.21%,F1值为85.95%;GP8数据集:精确率为95.03%,F1值为93.98%作物病虫害诊断2023[93]BERTCNN以知识图谱为辅助挖掘潜在信息,并利用BERTCNN实现病虫害文本的特征提取与诊断北京市植物保护站、多个农业信息百科网站多种病虫害诊断综合精确率达到93.13%小麦锈病预测2020[94]BILSTM将知识图谱三元组转化为特征向量并输入到BILSTM模型中训练以实现模型预测陕西实地采集数据、农业语料库精确率平均值达到93.21%作物预测作物产量预测2020[95]基于框架和机器学习模型通过框架构建作物知识图谱并评估不同机器学习模型的预测效果印度开放政府数据平台、印度农业网站Gradient Boosting Regressor 模型在Rabi作物数据集的均方根误差和决定系数分别为0.482和0.616农业气象灾害监测2023[96]基于规则和计算框架将专家知识形式化为规则实现时空知识图谱的更新和农业气象数据的监测河南农田气象数据、欧洲航天气象局监测出2019年河南三县地区受干热风中重度影响农田斑块的归一化植被指数平均值分别下降0.12、0.2、0.31食品安全风险预测2023[97]MLP、Transformer集成历史信息、全局信息等多种生成方法来实现时序知识图谱上的食品安全风险预测国家市场监督管理总局2018—2021年食品监督管理抽样数据精确率达到86.15%,MRR达到88.64%

4 结论与可研究的开放性问题

4.1 结论

通过回顾和梳理近年来国内外农业知识图谱的构建方法、关键技术以及上层应用等方面的工作,针对这3方面的研究现状得出以下结论:

(1)目前多数农业知识图谱的构建采用自顶向下和自底向上相结合的方法,原因在于自顶向下方法手动构建的农业知识本体质量较高,且可移植性和重用性更强,但往往需要专家的深度参与和大量的人力成本,而自底向上方法虽然显著节省了人力成本,但由于技术并不成熟,从文本中抽象出的本体、概念以及关系的质量和准确率均不高。当前两种方法的结合不仅在一定程度上缓解了人力成本,提高了知识抽取的效率,同时也提高了本体构建的质量。然而随着未来自动化构建技术的进步,构建农业知识图谱的人工干预比例将逐渐降低,自底向上方法将具有更广阔的应用前景。

(2)农业知识图谱构建涉及的关键技术分为本体建模、信息抽取、知识融合和知识加工,其中本体建模和信息抽取等技术的发展已经趋于成熟,目前在农业领域开展了较多研究;而由于农业跨领域数据构建的难度较大、融合方法复杂多样并不统一,农业知识融合和知识加工等技术的研究相对滞后,尤其是实体链接方法和图谱质量评估方法的研究相对匮乏,未来农业跨领域知识图谱的构建应该关注这些技术方向。

(3)随着农业知识图谱的发展与应用,基于知识图谱的农业上层应用从早期最基本的信息检索逐渐扩展到近年来主流的知识问答、信息推荐、专家诊断系统以及作物预测等方面,并且在这些方面,知识图谱均展现出了巨大的发展潜力。其次,鉴于农业数据的复杂性以及大规模、高质量数据集获取的困难,应用技术层面多数从基于规则或传统机器学习的方法逐渐过渡到表现优异、样本规模需求小的深度学习技术,如用于特征提取任务的BERT、CNN等模型。此外,随着农业应用对时序性知识和空间位置数据等需求的增加,农业环境监测与作物预测等实时性数据的引入也促使时空知识图谱从初步研究逐渐转向发展应用。

4.2 可研究的开放性问题

通过对知识图谱技术在农业中的研究现状和发展趋势进行分析,总结了当前农业知识图谱技术存在的一些可研究的开放性问题,并认为未来研究可以重点关注以下方面。

4.2.1 多模态知识推理

多模态数据的推理技术是指将不同模态的数据例如文字、图像、音频等联系到一起,形成一个知识网络进行推理,相比仅有文本数据的知识图谱,具有拓展性更好、知识描述更立体等优点。多模态数据尽管在农业知识图谱的构建领域有一些研究案例,如采用ComplEx模型学习多模态葡萄知识图谱的嵌入[82]、结合规则库和本体模型实现多模态时空水稻知识图谱的构建[98],然而在多跳推理方面由于需要图像、音频、视频等多种识别技术、表示学习技术和推理技术的结合,因此仍然面临着复杂的问题。

在农业中,多模态知识推理可以帮助知识图谱为上层应用如问答系统、推荐系统等提供语义丰富、知识多维度的数据支撑,例如在图3的多模态农业知识图谱示例中,用户在问答系统中输入查询小麦病害信息的问句,通过知识图谱的多跳推理可以从小麦实体遍历到小麦白粉病实体以及邻近实体查询出小麦白粉菌、病征图像、抗病药物等信息。这对农业知识图谱的发展提供了潜在的研究价值,因此未来应积极探索多模态数据的推理技术在农业知识图谱中应用的研究。

图3 多模态农业知识图谱示例

Fig.3 Example of a multimodal agricultural knowledge graph

4.2.2 强时效性知识更新

农作物监测与预测系统需要及时更新一些农业动态数据,如作物监测的各种实时性指标:温湿度、光照强度、气体含量等,以使得预测的结果更具实时性和参考价值,并帮助农业工作者及时调整生产活动和降低风险损失。然而,现有的农业知识图谱大多由静态数据构建,在时序性知识更新技术上的研究并不深入,如注入地理和时间知识的作物产量预测[74]、融合遥感和气象数据的时空知识图谱[96]等工作虽然均考虑到了一部分强时效性知识的特殊性,但在图谱节点和关系的更新效果上还有一定提升空间,同时所涉及的图谱更新算法和表示学习方法尚未形成统一,因此未来农业监测与预测应用需要进一步研究强时效性数据在知识图谱中的动态更新。

4.2.3 多语言知识查询

通过语义翻译将各个单一语言的农业知识图谱进行实体匹配与链接可以构建出跨语言的农业知识图谱,如图4所示。跨语言农业知识图谱可以识别用户查询语句的语言类别,并将查询语句转化为图谱中的多种语言文本进行检索,从而提供多语言的知识查询服务。这不仅有利于更广泛地传播农业知识和交流经验,同时可以帮助机器翻译、问答系统、信息推荐等上层应用实现与用户之间的多语言交互。然而,目前多语言知识图谱在农业中的应用较为匮乏,主要面临着不同语言的农业实体因知识覆盖面不一致、一词多义等情况导致实体对齐与融合困难等问题,后续需要逐步深入探索和研究。

图4 跨语言农业知识图谱链接

Fig.4 Cross-language linking of agricultural knowledge graphs

4.2.4 跨领域数据融合

当前,农业中多数的知识图谱如跨农业生产子域和食品加工子域的知识图谱[63]、跨食品领域的健康饮食知识图谱[84]等仅涵盖一到两个特定的子领域,难以实现更多领域之间的数据互联和共享,从而限制了农业知识图谱的应用;而跨领域农业数据融合可以将知识形成产业链,使得不同领域知识间的隐性关系更容易被发现和挖掘,提高知识关联度和利用率。然而,不同领域存在差异,构建有效的语义关联并不容易,同时数据规模、可信度、多源异构以及更新维护等因素也使得跨领域的数据融合面临着很大的挑战。

4.2.5 子领域知识图谱构建

随着知识图谱技术在农业领域的研究与应用,一些农业特定领域实现了基于知识图谱的上层应用,如信息检索、智能问答等。然而目前大部分子领域尚未引入知识图谱技术,管理领域知识的水平仍然滞后,一方面原因是,来自线下书籍和农田实验的多源异构数据转化为线上结构化知识的难度大,且需要大量的人力资源;另一方面,尽管知识图谱已有许多应用,但对于小规模的农业子领域,通常有独特的数据管理方式,短时间内难以寻求知识图谱和该领域应用的结合点,从而使得跨领域数据融合和多模态知识推理等信息技术更难在这些子领域中开展。因此农业子领域知识图谱的构建需要专家充分考虑领域特定的复杂性,并利用先进的技术和灵活的知识建模方法来处理更为复杂的农业信息。

参考文献

[1] STEINER T, VERBORGH R, TRONCY R, et al. Adding realtime coverage to the Google Knowledge Graph[C]∥11th International Semantic Web Conference (ISWC 2012), 2012.

[2] YAN J, WANG C, CHENG W, et al. A retrospective of knowledge graphs[J]. Frontiers of Computer Science, 2018, 12(1): 55-74.

[3] FENSEL D, IMEK U, ANGELE K, et al. Introduction: what is a knowledge graph?[M]∥Knowledge graphs: methodology, tools and selected use cases. Cham:Springer International Publishing, 2020: 1-10.

[4] WU T, QI G, LI C, et al. A survey of techniques for constructing Chinese knowledge graphs and their applications[J]. Sustainability, 2018, 10(9): 1-26.

[5] 刘峤,李杨,段宏,等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600.LIU Jiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques[J]. Journal of Computer Research and Development, 2016, 53(3): 582-600.(in Chinese)

[6] YANI M, KRISNADHI A. Challenges, techniques, and trends of simple knowledge graph question answering: a survey[J]. Information, 2021, 12(7): 1-31.

[7] ZHU D, WEN Y, WAN Z. Review of recommendation systems based on knowledge graph[J]. Data Analysis and Knowledge Discovery, 2022, 5(12): 1-13.

[8] REINANDA R, MEIJ E, RIJKE M. Knowledge graphs: an information retrieval perspective[J]. Foundations and Trends in Information Retrieval, 2020, 14(4): 289-444.

[9] G, GROTH P. Defining a knowledge graph development process through a systematic review[J]. ACM Transactions on Software Engineering and Methodology, 2023, 32(1): 1-40.

[10] BOLLACKER K, EVANS C, PARITOSH P, et al. Freebase: a collaboratively created graph database for structuring human knowledge[C]∥Proceedings of the 2008 ACM SIGMOD International Conference on Management of Data, 2008.

[11] VRANDEI D, KRÖTZSCH M. Wikidata: a free collaborative knowledgebase[J]. Communications of the ACM, 2014, 57(10): 78-85.

[12] XU B, XU Y, LIANG J, et al. CN-DBpedia: a never-ending Chinese knowledge extraction system[C]∥International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, 2017.

[13] LEHMANN J, ISELE R, JAKOB M, et al. Dbpedia—a large-scale, multilingual knowledge base extracted from Wikipedia[J]. Semantic Web, 2015, 6(2): 167-195.

[14] WISHART D S, FEUNANG Y D, GUO A C, et al. DrugBank 5.0: a major update to the DrugBank database for 2018[J]. Nucleic Acids Research, 2018, 46(D1):1074-1082.

[15] ALGOV V, KVET M, KVET M, et al. Imdb database performance analysis[C]∥2022 IEEE 10th Jubilee International Conference on Computational Cybernetics and Cyber-Medical Systems (ICCC), 2022.

[16] TAN Z, LIU C, MAO Y, et al. AceMap: a novel approach towards displaying relationship among academic literatures[C]∥Proceedings of the 25th International Conference Companion on World Wide Web, 2016.

[17] 张宇,郭文忠,林森,等. 基于Neo4j的草莓种植管理知识图谱构建及验证[J]. 现代农业科技, 2022(1): 223-230.ZHANG Yu, GUO Wenzhong, LIN Sen, et al. Construction and verification of knowledge graph of strawberry planting management based on Neo4j[J]. Modern Agricultural Science and Technology, 2022(1): 223-230.(in Chinese)

[18] 许鑫,岳金钊,赵锦鹏,等. 小麦品种知识图谱构建与可视化研究[J]. 计算机系统应用, 2021, 30(6): 286-292.XU Xin, YUE Jinzhao, ZHAO Jinpeng, et al. Construction and visualization of knowledge map of wheat varieties[J]. Computer Systems &Applications, 2021, 30(6): 286-292.(in Chinese)

[19] BESTA M, GERSTENBERGER R, PETER E, et al. Demystifying graph databases: analysis and taxonomy of data organization, system designs, and graph queries[J]. ACM Computing Surveys, 2023, 56(2): 1-40.

[20] HAO X, JI Z, LI X, et al. Construction and application of a knowledge graph[J]. Remote Sensing, 2021, 13(13): 1-19.

[21] MILLER J. Graph database applications and concepts with Neo4j[C]∥Proceedings of the Southern Association for Information Systems Conference, 2013.

[22] MONTEIRO J, S F, BERNARDINO J. Experimental evaluation of graph databases: JanusGraph, Nebula Graph, Neo4j, and TigerGraph[J]. Applied Sciences, 2023, 13(9): 1-16.

[23] FERNANDES D, BERNARDINO J. Graph databases comparison: AlleGrograph, ArangoDB, InfiniteGraph, Neo4J, and OrientDB[J]. Data, 2018, 10: 1-8.

[24] 姜丽华,赵瑞雪,董春岩,等. 基于深度学习的水产病害可视化知识图谱构建与验证[J]. 农业工程学报, 2023, 39(15): 259-267.JIANG Lihua, ZHAO Ruixue, DONG Chunyan, et al. Construction and verification of the visual knowledge map of aquatic diseases based on deep learning[J]. Transactions of the CSAE, 2023, 39(15): 259-267.(in Chinese)

[25] 吴赛赛,周爱莲,谢能付,等. 基于深度学习的作物病虫害可视化知识图谱构建[J]. 农业工程学报, 2020, 36(24): 177-185.WU Saisai, ZHOU Ailian, XIE Nengfu, et al. Construction of visualization domain-specific knowledge graph of crop diseases and pests based on deep learning[J]. Transactions of the CSAE, 2020, 36(24): 177-185.(in Chinese)

[26] 徐增林,盛泳潘,贺丽荣,等. 知识图谱技术综述[J]. 电子科技大学学报, 2016, 45(4): 589-606.XU Zenglin, SHENG Yongpan, HE Lirong, et al. Review on knowledge graph techniques[J]. Journal of University of Electronic Science and Technology of China, 2016, 45(4): 589-606.(in Chinese)

[27] TIWARI S, GAURAV D, SRIVASTAVA A, et al. A preliminary study of knowledge graphs and their construction[C]∥Emerging Technologies in Data Mining and Information Security, 2021.

[28] BRACK A, HOPPE A, STOCKER M, et al. Analysing the requirements for an open research knowledge graph: use cases, quality requirements, and construction strategies[J]. International Journal on Digital Libraries, 2022, 23(1): 33-55.

[29] MARTINEZ-RODRIGUEZ J, LPEZ-ARÉVALO I, RIOS-ALVARADO A. Openie-based approach for knowledge graph construction from text[J]. Expert Systems with Applications, 2018, 113: 339-355.

[30] CHEN Y, KUANG J, CHENG D, et al. Agrikg: an agricultural knowledge graph and its applications[C]∥DASFAA 2019 International Workshops: BDMS, BDQM, and GDMA, 2019.

[31] 张博凯,李想. 基于知识图谱的Android端农技智能问答系统研究[J]. 农业机械学报, 2021, 52(增刊): 164-171.ZHANG Bokai, LI Xiang. Design of agricultural question answering system based on knowledge graph[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(Supp.): 164-171.(in Chinese)

[32] GARIJO D, OSORIO M. OBA: an ontology-based framework for creating REST APIS for knowledge graphs[C]∥The Semantic Web-ISWC 2020: 19th International Semantic Web Conference, 2020.

[33] 陈明,朱珏樟,席晓桃. 基于知识图谱的花卉病虫害知识管理方法[J]. 农业机械学报, 2023, 54(3): 291-300.CHEN Ming, ZHU Juezhang, XI Xiaotao. Knowledge management method of flower diseases and pests based on knowledge graph[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(3): 291-300.(in Chinese)

[34] 刘明鹏,王忠明,马文君. 基于本体的造林树种知识图谱构建与应用[J]. 北京林业大学学报, 2023, 45(8): 109-122.LIU Mingpeng, WANG Zhongming, MA Wenjun. Construction and application of ontology based knowledge graph for afforestation tree species[J]. Journal of Beijing Forestry University, 2023, 45(8): 109-122.(in Chinese)

[35] 穆维松,刘天琪,苗子溦,等. 知识图谱技术及其在农业领域应用研究进展[J]. 农业工程学报, 2023, 39(16): 1-12.MU Weisong, LIU Tianqi, MIAO Ziwei, et al. Research progress on knowledge graph technology and its application in agriculture[J]. Transactions of the CSAE, 2023, 39(16): 1-12.(in Chinese)

[36] 赵明,杜亚茹,杜会芳,等. 植物领域知识图谱构建中本体非分类关系提取方法[J]. 农业机械学报, 2016, 47(9): 278-284.ZHAO Ming, DU Yaru, DU Huifang, et al. Research on ontology non-taxonomic relations extraction in plant domain knowledge graph construction[J]. Transactions of the Chinese Society for Agricultural Machinery, 2016, 47(9): 278-284.(in Chinese)

[37] 赵继春,孙素芬,郭建鑫,等. 农业在线学习资源知识图谱构建与推荐技术研究[J]. 计算机应用与软件, 2022, 39(8): 69-75.ZHAO Jichun, SUN Sufen, GUO Jianxin, et al. Research on the construction of knowledge graph and recommendation technology of agricultural online learning resources[J]. Computer Applications and Software, 2022, 39(8): 69-75.(in Chinese)

[38] GOLDSTEIN A, FINK L, RAVID G. A framework for evaluating agricultural ontologies[J]. Sustainability, 2021, 13(11): 1-12.

[39] KHADIR A, ALIANE H, GUESSOUM A. Ontology learning: grand tour and challenges[J]. Computer Science Review, 2021, 39: 1-14.

[40] LI D, KANG L, CHENG X, et al. An ontology-based knowledge representation and implement method for crop cultivation standard[J]. Mathematical and Computer Modelling, 2013, 58(3): 466-473.

[41] BONACIN R, NABUCO O, PIEROZZI JUNIOR I. Ontology models of the impacts of agriculture and climate changes on water resources: scenarios on interoperability and information recovery[J]. Future Generation Computer Systems, 2016, 54: 423-434.

[42] ABRAHO E, HIRAKAWA A. Task ontology modeling for technical knowledge representation in agriculture field operations domain[C]∥2017 Second International Conference on Information Systems Engineering (ICISE), 2017.

[43] 王向前,张宝隆,李慧宗. 本体研究综述[J]. 情报杂志, 2016, 35(6): 163-170.WANG Xiangqian, ZHANG Baolong, LI Huizong. Overview of ontology research[J]. Journal of Intelligence, 2016, 35(6): 163-170.(in Chinese)

[44] AHSAN M, MOTLA Y, ASIM M. Knowledge modeling fore-agriculture using ontology[C]∥2014 International Conference on Open Source Systems &Technologies, 2014.

[45] CHOUGULE A, JHA V, MUKHOPADHYAY D. Adaptive ontology construction method for crop pest management[C]∥Proceedings of the International Conference on Data Engineering and Communication Technology: ICDECT 2016, 2016.

[46] AL-ASWADI F, CHAN H, GAN K. Automatic ontology construction from text: a review from shallow to deep learning trend[J]. Artificial Intelligence Review, 2020, 53: 3901-3928.

[47] WANG T, GU H, WU Z, et al. Multi-source knowledge integration based on machine learning algorithms for domain ontology[J]. Neural Computing and Applications, 2020, 32: 235-245.

[48] 王超,李书琴,肖红. 基于文献的农业领域本体自动构建方法研究[J]. 计算机应用与软件, 2014, 31(8): 71-74.WANG Chao, LI Shuqin, XIAO Hong. Research on literature-based automatic ontology construction method for agricultural domain[J]. Computer Applications and Software, 2014, 31(8): 71-74.(in Chinese)

[49] DEEPA R, VIGNESHWARI S. An effective automated ontology construction based on the agriculture domain[J]. ETRI Journal, 2022, 44(4): 573-587.

[50] CHATTERJEE N, KAUSHIK N. RENT: regular expression and NLP-based term extraction scheme for agricultural domain[C]∥Proceedings of the International Conference on Data Engineering and Communication Technology: ICDECT 2016, 2016.

[51] 李想,魏小红,贾璐,等. 基于条件随机场的农作物病虫害及农药命名实体识别[J]. 农业机械学报, 2017, 48(增刊): 178-185.LI Xiang, WEI Xiaohong, JIA Lu, et al. Recognition of crops, diseases and pesticides named entities in Chinese based on conditional random fields[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(Supp.): 178-185.(in Chinese)

[52] 张吉祥,张祥森,武长旭,等. 知识图谱构建技术综述[J]. 计算机工程, 2022, 48(3): 23-37.ZHANG Jixiang, ZHANG Xiangsen, WU Changxu, et al. Survey of knowledge graph construction techniques[J]. Computer Engineering, 2022, 48(3): 23-37.(in Chinese)

[53] 李林,周晗,郭旭超,等. 基于多源信息融合的中文农作物病虫害命名实体识别[J]. 农业机械学报, 2021, 52(12): 253-263.LI Lin, ZHOU Han, GUO Xuchao, et al. Named entity recognition of diseases and insect pests based on multi source information fusion[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(12): 253-263.(in Chinese)

[54] 韦紫君,宋玲,胡小春,等. 基于实体级遮蔽BERT与BiLSTM-CRF的农业命名实体识别[J]. 农业工程学报, 2022, 38(15): 195-203.WEI Zijun, SONG Ling, HU Xiaochun, et al. Named entity recognition of agricultural based entity-level masking BERT and BiLSTM-CRF[J]. Transactions of the CSAE, 2022, 38(15): 195-203.(in Chinese)

[55] 李书琴,张明美,刘斌. 融合字词语义信息的猕猴桃种植领域命名实体识别研究[J]. 农业机械学报, 2022, 53(12): 323-331.LI Shuqin, ZHANG Mingmei, LIU Bin. Kiwifruit planting entity recognition based on character and word information fusion[J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(12): 323-331.(in Chinese)

[56] 蒲攀,张越,刘勇,等. Transformer优化及其在苹果病虫命名实体识别中的应用[J]. 农业机械学报, 2023, 54(6): 264-271.PU Pan, ZHANG Yue, LIU Yong, et al. Transformer optimization and application in named entity recognition of apple diseases and pests[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(6): 264-271.(in Chinese)

[57] SRINIVASAN R, SUBALALITHA C. A thesaurus based semantic relation extraction for agricultural corpora[C]∥International Conference on Computational Intelligence in Data Science, 2020.

[58] KAUSHIK N, CHATTERJEE N. Automatic relationship extraction from agricultural text for ontology construction[J]. Information Processing in Agriculture, 2018, 5(1): 60-73.

[59] 胡滨,汤保虎,姜海燕,等. 家禽诊疗文本多实体关系联合抽取模型研究[J]. 农业机械学报, 2021, 52(6): 268-276.HU Bin, TANG Baohu, JIANG Haiyan, et al. Joint extraction model of multi-entity relations for poultry diagnosis and treatment text[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(6): 268-276.(in Chinese)

[60] QIAO B, ZOU Z, HUANG Y, et al. A joint model for entity and relation extraction based on BERT[J]. Neural Computing and Applications, 2022, 34(5): 3471-3481.

[61] 李书琴,庞文婷. 嵌入词汇信息的BERT-CRF玉米育种实体关系联合抽取方法[J]. 农业机械学报, 2023,54(11):286-294.LI Shuqin, PANG Wenting. Joint extraction method of entity and relation in maize breeding based on BERT-CRF and word embedding[J]. Transactions of the Chinese Society for Agricultural Machinery, 2023,54(11):286-294.(in Chinese)

[62] XIE N. Research on agricultural ontology and fusion rules based knowledge fusion framework[J]. Agricultural Science &Technology, 2012, 13(12): 2638-2641.

[63] MULJARTO A, SALMON J, CHARNOMORDIC B, et al. A generic ontological network for agri-food experiment integration application to viticulture and winemaking[J]. Computers and Electronics in Agriculture, 2017, 140: 433-442.

[64] LI D, SHEN C, DAI X, et al. A kind of agricultural content networking information fusion method based on ontology[C]∥Cloud Computing and Security: 4th International Conference (ICCCS), 2018.

[65] 李天然,刘明童,张玉洁,等. 基于深度学习的实体链接研究综述[J]. 北京大学学报(自然科学版), 2021, 57(1): 91-98.LI Tianran, LIU Mingtong, ZHANG Yujie, et al. A review of entity linking research based on deep learning[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2021, 57(1): 91-98.(in Chinese)

[66] 刘峤,钟云,李杨,等. 基于图的中文集成实体链接算法[J]. 计算机研究与发展, 2016, 53(2): 270-283.LIU Jiao, ZHONG Yun, LI Yang, et al. Graph-based collective Chinese entity linking algorithm[J]. Journal of Computer Research and Development, 2016, 53(2): 270-283.(in Chinese)

[67] 谢世超,黄蔚,任祥辉. 一种基于BERT的文本实体链接方法[J]. 计算机与现代化, 2023(2): 58-61.XIE Shichao, HUANG Wei, REN Xianghui. A text entity linking method based on BERT[J]. Computer and Modernization, 2023(2): 58-61.(in Chinese)

[68] 牟向伟,陈燕,曹妍. 农产品冷链HACCP管理体系知识建模与推理[J]. 农业工程学报, 2016, 32(2): 300-308.MOU Xiangwei, CHEN Yan, CAO Yan. HACCP knowledge modeling and reasoning for agricultural products cold-chain logistics[J]. Transactions of the CSAE, 2016, 32(2): 300-308.(in Chinese)

[69] LIU Y, ZHAO X, ZHU X, et al. Knowledge expression and reasoning model for tomato disease diagnosis[C]∥2017 3rd International Conference on Information Management (ICIM), 2017.

[70] LI C, TANG Y, ZOU X, et al. A novel agricultural machinery intelligent design system based on integrating image processing and knowledge reasoning[J]. Applied Sciences, 2022, 12(15): 1-24.

[71] GUAN L, ZHANG J, GENG C. Diagnosis of fruit tree diseases and pests based on agricultural knowledge graph[C]∥2021 International Conference on Advances in Optics and Computational Sciences (ICAOCS), 2021.

[72] CHEN X, JIA S, XIANG Y. A review: knowledge reasoning over knowledge graph[J]. Expert Systems with Applications, 2020, 141: 112948.

[73] YAN W, ZHANG Z, ZHANG Q, et al. Deep data analysis-based agricultural products management for smart public healthcare[J]. Frontiers in Public Health, 2022, 10: 1-9.

[74] FAN J, BAI J, LI Z, et al. A GNN-RNN approach for harnessing geospatial and temporal information: application to crop yield prediction[C]∥Proceedings of the AAAI Conference on Artificial Intelligence, 2022.

[75] XUE B, ZOU L. Knowledge graph quality management: a comprehensive survey[J]. IEEE Transactions on Knowledge and Data Engineering, 2022, 35(5): 4969-4988.

[76] CHEN H, CAO G, CHEN J, et al. A practical framework for evaluating the quality of knowledge graph[C]∥Knowledge Graph and Semantic Computing: Knowledge Computing and Language Understanding: 4th China Conference, CCKS 2019, 2019.

[77] 李贯峰,李卫军. 一个基于枸杞病虫害领域本体的语义检索模型[J]. 计算机技术与发展, 2017, 27(9): 48-52.LI Guanfeng, LI Weijun. A semantic retrieval model with domain ontology based on wolfberry disease and pests[J]. Computer Technology and Development, 2017, 27(9): 48-52.(in Chinese)

[78] SUN X, WU H, HAO P, et al. Research on information integration method of agricultural products producing and managing based on knowledge graph[C]∥Computer and Computing Technologies in Agriculture XI: 11th IFIP WG 5.14 International Conference, 2019.

[79] 张海瑜,陈庆龙,张斯静,等. 基于语义知识图谱的农业知识智能检索方法[J]. 农业机械学报, 2021, 52(增刊): 156-163.ZHANG Haiyu, CHEN Qinglong, ZHANG Sijing, et al. Intelligent retrieval method of agricultural knowledge based on semantic knowledge graph[J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(Supp.): 156-163.(in Chinese)

[80] 张贤坤,李子璇,孙月. 基于知识图谱和BERT的食品案例检索方法[J]. 计算机应用与软件, 2021, 38(7): 137-146.ZHANG Xiankun, LI Zixuan, SUN Yue. Food case retrieval method based on knowledge graph and BERT[J]. Computer Applications and Software, 2021, 38(7): 137-146.(in Chinese)

[81] 郑泳智,吴惠粦,朱定局,等. 基于荔枝和龙眼病虫害知识图谱的问答系统[J]. 计算机与数字工程, 2021, 49(12): 2618-2622.ZHENG Yongzhi, WU Huilin, ZHU Dingju, et al. Question and answer system based on the knowledge graphs of litchi and longan diseases and insect pests[J]. Computer &Digital Engineering, 2021, 49(12): 2618-2622.(in Chinese)

[82] 杨硕,李书琴. 多模态知识图谱增强葡萄种植问答对的答案选择模型[J]. 农业工程学报, 2023, 39(14): 207-214.YANG Shuo, LI Shuqin. Enhancing answer selection model of grape planting using multimodal knowledge graph[J]. Transactions of the CSAE, 2023, 39(14): 207-214.(in Chinese)

[83] 杨喆,许甜,靳哲,等. 基于知识图谱的羊群疾病问答系统的构建与实现[J]. 华中农业大学学报, 2023, 42(3): 63-70.YANG Zhe, XU Tian, JIN Zhe, et al. Construction and application of knowledge graph of sheep &goat disease[J]. Journal of Huazhong Agricultural University, 2023, 42(3): 63-70.(in Chinese)

[84] HAUSSMANN S, SENEVIRATNE O, CHEN Y, et al. FoodKG: a semantics-driven knowledge graph for food recommendation[C]∥The Semantic Web-ISWC 2019: 18th International Semantic Web Conference, 2019.

[85] JIN Y, LIU J, WANG X, et al. Technology recommendations for an innovative agricultural robot design based on technology knowledge graphs[J]. Processes, 2021, 9(11): 1-21.

[86] XIE H, YANG J, HUANG C, et al. Recommendation algorithm for agricultural products based on attention factor decomposer and knowledge graph[C]∥2022 Asia Conference on Algorithms, Computing and Machine Learning (CACML), 2022.

[87] ZOU Y, PAN S, YANG F, et al. Precise recommendation method of suitable planting areas of maize varieties based on knowledge graph[J]. Agriculture, 2023, 13(3): 1-19.

[88] 戈为溪,周俊,袁立存,等. 基于知识图谱与案例推理的水稻精准施肥推荐模型[J]. 农业工程学报, 2023, 39(2): 126-133.GE Weixi, ZHOU Jun, YUAN Licun, et al. Recommendation model for rice precision fertilization using knowledge graph and case-based reasoning[J]. Transactions of the CSAE, 2023, 39(2): 126-133.(in Chinese)

[89] YU H, SHEN J, BI C, et al. Intelligent diagnostic system for rice diseases and pests based on knowledge graph[J]. Journal of South China Agricultural University, 2021, 42(5): 105-116.

[90] 翟增林,王天一. 融合知识图谱与深度学习的羊病诊断方法[J]. 计算机与数字工程, 2022, 50(12): 2831-2836.ZHAI Zenglin, WANG Tianyi. Diagnosis method of sheep disease based on knowledge graph and deep learning[J]. Computer &Digital Engineering, 2022, 50(12): 2831-2836.(in Chinese)

[91] WANG H, SHEN W, ZHANG Y, et al. Diagnosis of dairy cow diseases by knowledge-driven deep learning based on the text reports of illness state[J]. Computers and Electronics in Agriculture, 2023, 205: 1-11.

[92] 郑增威,李彦臻,刘益,等. 基于属性特征知识图谱的细粒度葡萄园害虫识别[J]. 农业工程学报, 2023, 39(11): 146-154.ZHENG Zengwei, LI Yanzhen, LIU Yi, et al. Identifying fine-grained vineyard pest using attribute knowledge graph[J]. Transactions of the CSAE, 2023, 39(11): 146-154.(in Chinese)

[93] 徐畅,张领先,乔岩. 基于电子病历的作物病虫害关联挖掘及智能诊断[J]. 智能化农业装备学报(中英文), 2023, 4(4): 1-10.XU Chang, ZHANG Lingxian, QIAO Yan. Association mining of crop diseases and intelligent diagnosis based on electronic medical records[J]. Journal of Intelligent Agricultural Mechanization, 2023, 4(4): 1-10.(in Chinese)

[94] 张善文,王振,王祖良. 结合知识图谱与双向长短时记忆网络的小麦条锈病预测[J]. 农业工程学报, 2020, 36(12): 172-178.ZHANG Shanwen, WANG Zhen, WANG Zuliang. Prediction of wheat stripe rust disease by combining knowledge graph and bidirectional long short term memory network[J]. Transactions of the CSAE, 2020, 36(12): 172-178.(in Chinese)

[95] CHOUDHARY N, CHUKKAPALLI S, MITTAL S, et al. YieldPredict: a crop yield prediction framework for smart farms[C]∥2020 IEEE International Conference on Big Data (Big Data), 2020.

[96] ZHANG W, PENG L, GE X, et al. Spatio-temporal knowledge graph-based research on agro-meteorological disaster monitoring[J]. Remote Sensing, 2023, 15(18): 1-18.

[97] SHI Y, ZHOU K, ZHOU M, et al. Temporal knowledge graph for food risk prediction[J]. IEEE Transactions on Artificial Intelligence, 2023,5(5):2217-2226.

[98] 许多,鲁旺平,许瑞清,等. 基于农业时空多模态知识图谱的水稻精准施肥决策方法[J]. 华中农业大学学报, 2023, 42(3): 281-292.XU Duo, LU Wangping, XU Ruiqing, et al. A method of deciding precision fertilization of rice based on spatiotemporal multi-modal knowledge graph of agriculture[J]. Journal of Huazhong Agricultural University, 2023, 42(3): 281-292.(in Chinese)

Review of Research Status and Prospects of Agricultural Knowledge Graphs

HOU Chen1,2 NIU Peiyu1

(1.College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China 2.National Engineering Laboratory for Big Data Analysis and Applications, Peking University, Beijing 100871, China)

AbstractIn the current development process of agricultural informatization, most sub-domains of agriculture face challenges such as dispersed data resources, difficulties in information integration, and low efficiency in knowledge utilization. As an emerging knowledge representation technology in recent years, knowledge graph has demonstrated powerful capabilities in semantic reasoning and data integration in specific agricultural domains. Simultaneously, it has enhanced the performance of some upper-level applications in agriculture. To systematically summarize recent research on the construction and application of knowledge graphs in the agricultural domain, the fundamentals of knowledge graphs and the process of agricultural knowledge graph construction were introduced. Furthermore, it summarized the key technologies involved in constructing an agricultural knowledge graph from four aspects: ontology modeling, information extraction, knowledge fusion, and knowledge processing. Subsequently, an overview of the current applications of agricultural knowledge graphs was provided and discussed in five aspects: information retrieval, question-answering systems, recommendation systems, expert diagnostic systems, and crop prediction. In conclusion, the research status of agricultural knowledge graphs was summarized and it was suggested that future research in agricultural knowledge graphs should explore areas such as multimodal knowledge reasoning, timely knowledge updating, multilingual knowledge queries, cross-domain data fusion, and sub-domain knowledge graph construction.

Key wordsknowledge graph; agriculture; information retrieval; question-answering system; recommendation system; expert diagnostic system; crop prediction

中图分类号:S126

文献标识码:A

文章编号:1000-1298(2024)06-0001-17

OSID:

doi:10.6041/j.issn.1000-1298.2024.06.001

收稿日期:2024-01-17

修回日期: 2024-02-08

基金项目:国家自然科学基金项目(62303472)

作者简介:侯琛(1989—),男,副教授,博士,主要从事知识计算、物联网、边缘计算和神经网络等研究,E-mail: chenhou@pku.edu.cn