【摘要】: 随着人们物质、文化以及生活水平的不断提高,越来越多的人不再满足于餐桌上的常见美味,为了保健养生,人们日渐寻求更加健康和天然的食品,而食用花卉因其不同于一般蔬菜的色彩、香味以及自身的营养价值获得了人们的青睐。以花为食是从中国古代开始就存在的一种饮食,花卉含有多种人体所需的营养物质,有着良好的营养保健功能,在各种饮食书籍中也存在着对花卉栽培、加工以及烹饪方法的记载。而我国地域辽阔,花卉资源极为丰富,对花卉饮食进行开发利用有着广阔的前景。如今互联网创造了 一个人们可以便捷搜索信息的平台,而目前的美食网站中少有将花卉作为一种食材进行分类,对于花卉食谱的记录纷繁杂乱,分布在不同的数据源中,且不同的数据源中的侧重点不同,涉及到花卉种类、营养、食疗等多个方面,搜索的结果单一且不全面,为用户的检索和寻找带来了困难。如何将整合这些来自不同数据源的知识,将隐含在半结构化和非结构化文本中的概念关联起来,构建概念之间的语义关系,为人们对花卉食用相关知识的检索提供更加丰富的语义信息是一个具有重要意义的研究问题。构建知识图谱则提供了一种有效可行的方式,知识图谱可以用来描述现实世界中的实体以及它们之间的关联关系,是一种结构化的语义知识库,所构建的知识图谱广泛应用在各种领域中并取得了很好的结果。构建花卉食谱的知识图谱可以将来自多数据源的半结构化和非结构化的知识进行处理,形成实体-关系-实体的基本三元组并进行结构化表示,可以帮助人们在进行花卉食用相关知识的搜索时获得更加高效和全面的结果,帮助人们更好的了解相关知识,可以为实现知识服务平台和智能问答系统提供可供参考的知识库以及一些思路和经验。本文研究了花卉食谱的知识图谱的构建,主要完成了以下三部分内容:(1)基于改进的领域本体构建方法完成了花卉食谱知识图谱的框架构建。通过参考其他学者对相似本体框架中概念的选取,根据花卉食谱数据的特点,定义了花卉食谱知识图谱中主要包含的七个实体,分别是花卉、花卉食谱、主要食材、烹饪工艺、营养成分、功效和症状,以及定义了实体之间的语义关系,并添加了相关属性信息,最后得出构建的花卉食谱知识图谱本体框架图并进行了本体评估。(2)对不同来源的数据进行采集和处理,并采用实体抽取的方式得到结构化的数据。首先采用网络爬虫和OCR识别的方式对花卉食谱数据进行数据采集,从多个食谱网站以及花卉饮食书籍中获取半结构化和非结构化的文本数据,进行高级分列、筛选、去重等预处理,得到部分已经结构化的数据后进行了简要分析。然后基于BiLSTM、CRF以及BiLSTM-CRF模型对处于部分非结构化文本中的功效和症状两类实体进行实体识别与抽取实验,对识别结果进行了对比及评价,以及对错误的识别结果进行了分析。最后统计了该知识图谱中的实体与关系的数量,得到结构化的数据。(3)基于Neo4j图数据库实现知识图谱的存储,完成花卉食谱知识图谱的构建。介绍了 Neo4j图数据库中基于Cypher语言进行存储和查询的方式,对构建出的知识图谱进行了部分展示,最后对该图谱的应用前景进行了讨论分析。
【学位授予单位】:南京农业大学
【学位级别】:硕士
【学位授予年份】:2020
相关知识
重要花卉植物高密度遗传连锁图谱构建研究进展
花卉遗传连锁图谱构建及QTL定位研究进展
基于知识图谱的水稻病虫害智能诊断系统
花卉遗传连锁图谱构建及QTL定位研究进展.pdf
森林碳汇研究热点与趋势——基于知识图谱分析
利用SSR分子标记构建甜瓜遗传图谱
基于GBS技术构建牡丹高密度遗传连锁图谱
矮牵牛遗传图谱构建及重瓣分子标记筛选
基于知识图谱的病虫害检测及防治推荐系统
基于ISSR标记的杜鹃花品种DNA指纹图谱的构建
网址: 花卉食谱的知识图谱构建研究 https://m.huajiangbk.com/newsview377178.html
上一篇: 以花入馔,食花养生季 |
下一篇: 【读城】疗与馔,莲花 |