
知识抽取
🔍 知识抽取:从数据中提炼知识的核心过程
模块简介
知识抽取是构建知识图谱的关键环节,旨在从各类数据源中提取出具有语义意义的实体、关系和属性信息。平台提供全面的知识抽取能力,涵盖概念定义、关系配置、结构化抽取、非结构化抽取四大功能模块,帮助用户将原始数据转化为可用于推理、分析和应用的结构化知识。
本章节将详细介绍各功能模块的操作流程及使用方法。
1. 概念配置
🧠 功能说明
概念配置模块用于定义知识体系中的基本语义单元——概念,如“人物”、“地点”、“组织机构”等。这些概念为后续知识抽取、图谱构建提供基础语义框架。
操作流程:
- 进入【知识抽取】 → 【概念配置】页面;

- 点击“新增”按钮,填写概念名称、配置概念的颜色等基本信息;(概念颜色用于后续图谱实体展示)

可通过“编辑”或“删除”按钮对已有概念进行维护;
支持按关键词快速查询已定义的概念;
所有操作均可实时生效并支持日志追溯。
2. 关系配置
⚙️ 功能说明
关系配置模块用于定义不同概念之间的关联规则,如“出生地”、“任职于”等,确保系统在抽取过程中能正确识别并建立知识之间的语义联系。
操作流程:
- 进入【知识抽取】 → 【关系配置】页面;

- 点击“新增”,选择起点概念与终点概念,定义关系类型;

可随时修改或删除已有关系;
支持按关系名或涉及概念进行搜索筛选。
3. 非结构化抽取
📝 功能说明
非结构化抽取模块用于处理如文本文件、网页内容等无固定格式的数据源,借助自然语言处理(NLP)技术自动识别并提取其中的实体、事件和关系信息。
操作流程:
- 进入【知识抽取】 → 【非结构化抽取】页面;

- 点击“新建任务”,填写任务名称,从知识中心导入知识文件,并导入本次抽取任务相关的三元组,保存任务;

- 点击"执行",启动任务后,系统自动执行抽取流程,请耐心等待抽取完成;

- 抽取完成后,点击"抽取结果",查看抽取结果;

- 点击图谱节点,可查看图谱详情,进行人工审核。审核通过后,点击"发布",将图谱发布至最终总的图谱中,支撑后续图谱相关应用。

4. 结构化抽取
🗃️ 功能说明
结构化抽取模块用于从结构化数据库中提取知识信息。通过概念、关系的配置,生成标准化的三元组数据。
操作流程:
- 进入【知识抽取】 → 【结构化抽取】页面;

- 新建任务,填写任务名称、选择数据源、导入需要抽取的数据表;

结构化抽取之前,请先配置数据源。配置数据源可参考 数据源配置
- 映射字段至对应的概念、属性、关系。(Tips:数据表 -> 概念;数据表字段 -> 属性;关联表 -> 关系)

结构化抽取及抽取结果人工审核及发布操作,同非结构化数据。
注:结构化抽取及非结构化抽取,需使用超级管理员账号,开启系统的定时任务【结构化任务抽取】、【非结构化任务抽取】。否则将会导致抽取任务一直处于执行中的状态。
✅ 总结
知识抽取模块是构建知识图谱的重要基础,涵盖了从概念定义、关系配置到结构化与非结构化数据抽取的完整流程。无论是面对文本资料还是数据库表单,平台都能提供高效、准确的知识提取能力,助力企业实现智能化知识管理。
如需了解如何探索知识图谱及其他知识应用,请继续阅读 下一章节:知识融合 。