【机情无限精彩毕设】机械2026届毕业设计（论文）中期检查优秀案例分享第四期——智能起重装备的故障知识图谱构建与检索方法研究

发布时间:2026.04.10 | 编辑: 李艳梅 | 浏览次数:

学生姓名：丁薛宸

班级：工程2022-01班

指导教师：张敏

毕设题目：智能起重装备的故障知识图谱构建与检索方法研究

一、概况

1.选题意义

随着智能制造与工业互联网发展，智能起重装备成为核心设备，其可靠性直接影响生产与安全。当前故障诊断依赖人工经验，存在知识分散、诊断效率低、误判率高、复合故障难定位等问题，难以适配智能化需求，易导致停机停产。知识图谱为上述问题提供有效方案。本研究构建起重装备故障知识图谱，实现故障知识建模、检索与推理，推动诊断从经验驱动转向知识驱动。研究攻克多源异构数据融合与故障传导关联推理难题，填补行业应用空白。

2.任务分解

(1) 了解智能起重装备常见故障，收集知识图谱相关资料

(2) 设计故障分类标签，开始收集故障数据

(3) 训练模型自动识别维修工单、故障报告信息，测试传感器数据异常识别功能

(4) 整理数据统一术语，填补数据缺失信息

(5) 从数据里提取故障部件、原因、维修方法等关键信息，设计规则确保信息准确

(6) 合并不同来源信息解决矛盾，搭建知识图谱存储结构

(7) 构建故障知识网络，设计新故障自动更新方法

(8) 开发故障查询功能，优化查询速度和准确性

(9) 整合功能开发原型系统，测试系统稳定性

二、已完成工作

1. 数据获取与知识抽取

围绕智能起重装备故障知识图谱构建需求，已完成多源异构故障数据的采集与实体关系抽取工作。数据来源主要包括学术案例数据、行业公开技术报告、设备运维手册、现场故障记录等，并通过人工查阅整理补充关键故障知识。在知识抽取环节，采用BERT 预训练模型完成中文故障实体与关系抽取，使用RoBERTa 模型处理英文专业术语与实体信息，实现机械、电气、通信、智能系统等多类型故障知识的自动化提取，为后续知识建模提供了高质量数据基础。

模型	原始抽取文本	抽取实体	抽取关系
BERT	减速器发生漏油故障，由密封老化、结合面不平、油位偏高引起，处理为更换密封、调整油位	减速器、漏油、密封、油位	存在、造成、处理
BERT	制动器响应迟缓，因液压泄漏、制动液老化、活塞卡滞，需检修泄漏、更换制动液、清理活塞	制动器、响应迟缓、液压、制动液	引发、导致、排除
BERT	PLC 系统无输出，由程序错误、电源故障、模块损坏造成，应核查程序、修复电源、更换模块	PLC、无输出、程序、电源、模块	故障、原因、修复
RoBERTa	The motor is overheating caused by fan failure and high load. Solutions: replace fan, reduce load	Motor、Overheating、Fan、Load	Cause、Result、Solution

表1 抽取部分图

2. 数据预处理与标准化

对采集的原始数据开展系统化预处理，确保数据规范统一、可直接用于知识建模。具体包括：噪声清洗，去除页眉页脚、无关引用、乱码符号与无效文本；文本规整，完成语句拆分、多余空格清理、全半角字符统一；专业分词，结合智能起重装备领域词典实现精准分词；轻度过滤，剔除通用停用词，完整保留故障语义信息；术语归一化，对同义故障名称、部件名称进行统一表述、去重与融合。经过处理后，数据质量显著提升，形成标准化故障数据集。

图1 标准化数据部分图

图2 数据收集统计

3. 故障知识图谱构建

基于预处理后的故障数据，完成故障知识抽取、实体建模与关系映射，并依托Neo4j 图数据库完成知识图谱搭建。通过 Cypher 语句实现故障实体节点创建、属性定义与关系关联，构建出故障类型-故障部位-故障表现-故障原因-解决方法的完整语义网络，清晰呈现各故障要素间的关联逻辑。目前已完成大量实体节点与关系边的构建，形成可可视化、可查询、可推理的智能起重装备故障知识图谱。

图3 知识图谱节点名称及数量

图4 故障类型→故障部位图5 知识图谱部分示意图

4. 故障知识检索方法设计

完成面向故障知识图谱的初步检索算法设计与实现。以TF-IDF 加权为核心，对输入故障描述文本进行清洗、向量化转换，构建 487 维特征向量空间；结合余弦相似度与欧式距离双指标加权计算，实现故障现象与知识库内容的精准匹配。

图6 部分检索结果

三、下一步工作计划

1. 优化故障知识抽取流程，提升抽取效率与可实现性

针对现有数据预处理与实体关系抽取依赖人工、效率偏低的问题，优化基于 BERT/RoBERTa 的知识抽取方案，规范数据输入格式，减少人工校对工作量。建立多源异构数据统一处理机制，提升实体、关系抽取的自动化程度与稳定性，确保抽取结果可直接用于知识图谱构建，显著提升整体建模效率。

2. 开展检索算法优化与创新研究，提升检索效率与精度

以现有TF-IDF与混合相似度算法为基础，深入研究适配故障知识图谱的创新检索算法，优化语义匹配与权重分配策略。通过算法改进缩短检索响应时间，提升故障知识匹配的精准度，实现从快速检索向精准高效检索升级，满足现场运维实时性需求。

3. 完成故障知识检索平台搭建，实现全流程功能集成

依托已构建的故障知识图谱，开发可视化检索平台，集成知识查询、故障定位、方案推送、结果展示等核心功能。实现故障描述输入，智能语义检索，知识结果输出的全流程闭环，完成界面优化、接口调试与稳定性测试，形成可直接用于工程现场的智能检索工具。

问题一：知识抽取方面BERT与RoBERTa的训练集的数据从哪里来？

回答：在基于BERT与RoBERTa模型开展故障知识实体关系抽取的过程中，模型训练所需的标注数据集主要由AI生成数据得到。由于智能起重装备故障领域缺少公开、高质量、大规模的人工标注语料，为快速启动模型训练，我采用 AI 生成方式模拟故障文本、标注实体与关系，形成初始训练集。但受限于 AI 生成数据存在表述不规范、场景单一、标注精度有限、与真实故障文本存在偏差等问题，导致模型在实际抽取时泛化能力不足，实体识别与关系抽取效果未达预期，最终仍需大量人工核对与修正，抽取效率与准确率较低。后续将针对这一问题进行优化。

问题二：你目前的检索算法是什么？有什么创新点？

回答：目前我以TF-IDF加权向量化为基础，构建了487维故障特征向量空间，并采用余弦相似度与欧式距离各占50% 加权融合的方式进行初步检索。为提升检索精度与创新性，我正在尝试加入位置衰减权重改进的TF-IDF算法，同时引入杰卡德相似度强化语义匹配能力，将三者进行融合，设计并实现自适应权重综合检索算法。但现阶段该算法仍处于调试阶段，受限于相似度分配策略、参数设置及领域特征适配不足，整体效果尚未达到预期，后续我会继续优化权重分配策略与相似度计算逻辑，进一步提升检索的准确性与效率。

通过本阶段的课题研究，我在理论认知、工程实践、问题解决与科研素养等方面均得到了全面、系统的锻炼与提升。

在理论层面，我系统学习并掌握了知识图谱、实体关系抽取、图数据库建模等核心理论，深入理解了多源异构故障数据的融合机制与语义检索原理。通过对智能起重装备故障体系的梳理，明确了故障知识结构化、标准化建模的重要价值，掌握了 BERT/RoBERTa 预训练模型、TF-IDF、语义相似度计算等关键技术的应用逻辑。

在工程实践层面，我独立完成了故障数据采集、文本预处理、知识抽取、知识图谱构建与初步检索算法设计等全流程工作。基于Neo4j 完成故障知识网络搭建，熟练掌握了数据清洗、术语归一、实体关系映射、Cypher 语句编写等工程化技能。在知识抽取与图谱构建过程中，不断优化流程、规范格式，切实提升了数据处理与工程落地的实践能力。

在问题解决层面，面对关系交叉重复、抽取效率低、数据整理繁琐、算法创新难度大等实际困难，我学会了拆解问题、查阅文献、对比方案与迭代优化。通过不断调整抽取策略、优化数据格式、改进相似度计算方法，逐步提升了故障知识建模与检索的稳定性和准确性，形成了严谨务实的科研思维与问题排查能力。

此外，本阶段工作也锻炼了我的项目统筹与时间规划能力。在数据处理、模型搭建、算法调试等多项任务并行推进的过程中，我能够合理安排进度、及时记录实验过程，为后续课题完善与系统开发积累了宝贵经验。

总体而言，本课题将自然语言处理、知识图谱、故障诊断与智能运维有机结合，显著提升了我的跨学科研究、编程实现与工程实践能力，也为后续完成算法优化、平台搭建与课题收尾奠定了坚实基础。

【机情无限 精彩毕设】机械2026届毕业设计（论文）中期检查优秀案例分享第四期——智能起重装备的故障知识图谱构建与检索方法研究

【机情无限精彩毕设】机械2026届毕业设计（论文）中期检查优秀案例分享第四期——智能起重装备的故障知识图谱构建与检索方法研究