学院首页 > 人才培养 > 本科生培养 > 通知公告 > 正文

【机情无限 精彩毕设】机械2026届毕业设计(论文)中期检查优秀案例分享第四期——智能起重装备的故障知识图谱构建与检索方法研究

发布时间:2026.04.10 | 编辑: 李艳梅

学生姓名:丁薛宸

班    工程2022-01班

指导教师:张敏

毕设题目智能起重装备的故障知识图谱构建与检索方法研究

一、概况

1.选题意义

随着智能制造与工业互联网发展,智能起重装备成为核心设备,其可靠性直接影响生产与安全。当前故障诊断依赖人工经验,存在知识分散、诊断效率低、误判率高、复合故障难定位等问题,难以适配智能化需求,易导致停机停产。知识图谱为上述问题提供有效方案。本研究构建起重装备故障知识图谱,实现故障知识建模、检索与推理,推动诊断从经验驱动转向知识驱动。研究攻克多源异构数据融合与故障传导关联推理难题,填补行业应用空白。

2.任务分解

(1) 了解智能起重装备常见故障,收集知识图谱相关资料

(2) 设计故障分类标签,开始收集故障数据

(3) 训练模型自动识别维修工单、故障报告信息,测试传感器数据异常识别功能

(4) 整理数据统一术语,填补数据缺失信息

(5) 从数据里提取故障部件、原因、维修方法等关键信息,设计规则确保信息准确

(6) 合并不同来源信息解决矛盾,搭建知识图谱存储结构

(7) 构建故障知识网络,设计新故障自动更新方法

(8) 开发故障查询功能,优化查询速度和准确性

(9) 整合功能开发原型系统,测试系统稳定性

    二、已完成工作

1. 数据获取与知识抽取

围绕智能起重装备故障知识图谱构建需求,已完成多源异构故障数据的采集与实体关系抽取工作。数据来源主要包括学术案例数据、行业公开技术报告、设备运维手册、现场故障记录等,并通过人工查阅整理补充关键故障知识。在知识抽取环节,采用BERT 预训练模型完成中文故障实体与关系抽取,使用RoBERTa 模型处理英文专业术语与实体信息,实现机械、电气、通信、智能系统等多类型故障知识的自动化提取,为后续知识建模提供了高质量数据基础。



模型

原始抽取文本

抽取实体

抽取关系


BERT

减速器发生漏油故障,由密封老化、结合面不平、油位偏高引起,处理为更换密封、调整油位

减速器、漏油、密封、油位

存在、造成、处理


BERT

制动器响应迟缓,因液压泄漏、制动液老化、活塞卡滞,需检修泄漏、更换制动液、清理活塞

制动器、响应迟缓、液压、制动液

引发、导致、排除


BERT

PLC 系统无输出,由程序错误、电源故障、模块损坏造成,应核查程序、修复电源、更换模块

PLC、无输出、程序、电源、模块

故障、原因、修复


RoBERTa

The motor is overheating caused by fan failure and high load. Solutions: replace fan, reduce load

Motor、Overheating、Fan、Load

Cause、Result、Solution

1 抽取部分图

    2. 数据预处理与标准化

对采集的原始数据开展系统化预处理,确保数据规范统一、可直接用于知识建模。具体包括:噪声清洗,去除页眉页脚、无关引用、乱码符号与无效文本;文本规整,完成语句拆分、多余空格清理、全半角字符统一;专业分词,结合智能起重装备领域词典实现精准分词;轻度过滤,剔除通用停用词,完整保留故障语义信息;术语归一化,对同义故障名称、部件名称进行统一表述、去重与融合。经过处理后,数据质量显著提升,形成标准化故障数据集。

图1 标准化数据部分图

           

     图2 数据收集统计

    3. 故障知识图谱构建

基于预处理后的故障数据,完成故障知识抽取、实体建模与关系映射,并依托Neo4j 图数据库完成知识图谱搭建。通过 Cypher 语句实现故障实体节点创建、属性定义与关系关联,构建出故障类型-故障部位-故障表现-故障原因-解决方法的完整语义网络,清晰呈现各故障要素间的关联逻辑。目前已完成大量实体节点与关系边的构建,形成可可视化、可查询、可推理的智能起重装备故障知识图谱。

           

图3 知识图谱节点名称及数量

                 

                        图故障类型→故障部位                          5 知识图谱部分示意图

    4. 故障知识检索方法设计

完成面向故障知识图谱的初步检索算法设计与实现。以TF-IDF 加权为核心,对输入故障描述文本进行清洗、向量化转换,构建 487 维特征向量空间;结合余弦相似度与欧式距离双指标加权计算,实现故障现象与知识库内容的精准匹配。                                     

                                                      

图6 部分检索结果

三、下一步工作计划

1. 优化故障知识抽取流程,提升抽取效率与可实现性

针对现有数据预处理与实体关系抽取依赖人工、效率偏低的问题,优化基于 BERT/RoBERTa 的知识抽取方案,规范数据输入格式,减少人工校对工作量。建立多源异构数据统一处理机制,提升实体、关系抽取的自动化程度与稳定性,确保抽取结果可直接用于知识图谱构建,显著提升整体建模效率。

2. 开展检索算法优化与创新研究,提升检索效率与精度

以现有TF-IDF与混合相似度算法为基础,深入研究适配故障知识图谱的创新检索算法,优化语义匹配与权重分配策略。通过算法改进缩短检索响应时间,提升故障知识匹配的精准度,实现从快速检索向精准高效检索升级,满足现场运维实时性需求。

3. 完成故障知识检索平台搭建,实现全流程功能集成

依托已构建的故障知识图谱,开发可视化检索平台,集成知识查询、故障定位、方案推送、结果展示等核心功能。实现故障描述输入,智能语义检索,知识结果输出的全流程闭环,完成界面优化、接口调试与稳定性测试,形成可直接用于工程现场的智能检索工具。

问题一知识抽取方面BERT与RoBERTa的训练集的数据从哪里来?

回答在基于BERT与RoBERTa模型开展故障知识实体关系抽取的过程中,模型训练所需的标注数据集主要由AI生成数据得到。由于智能起重装备故障领域缺少公开、高质量、大规模的人工标注语料,为快速启动模型训练,我采用 AI 生成方式模拟故障文本、标注实体与关系,形成初始训练集。但受限于 AI 生成数据存在表述不规范、场景单一、标注精度有限、与真实故障文本存在偏差等问题,导致模型在实际抽取时泛化能力不足,实体识别与关系抽取效果未达预期,最终仍需大量人工核对与修正,抽取效率与准确率较低。后续将针对这一问题进行优化。

问题二你目前的检索算法是什么?有什么创新点?

回答目前我以TF-IDF加权向量化为基础,构建了487维故障特征向量空间,并采用余弦相似度与欧式距离各占50% 加权融合的方式进行初步检索。为提升检索精度与创新性,我正在尝试加入位置衰减权重改进的TF-IDF算法,同时引入杰卡德相似度强化语义匹配能力,将三者进行融合,设计并实现自适应权重综合检索算法。但现阶段该算法仍处于调试阶段,受限于相似度分配策略、参数设置及领域特征适配不足,整体效果尚未达到预期,后续我会继续优化权重分配策略与相似度计算逻辑,进一步提升检索的准确性与效率。

通过本阶段的课题研究,我在理论认知、工程实践、问题解决与科研素养等方面均得到了全面、系统的锻炼与提升。

在理论层面,我系统学习并掌握了知识图谱、实体关系抽取、图数据库建模等核心理论,深入理解了多源异构故障数据的融合机制与语义检索原理。通过对智能起重装备故障体系的梳理,明确了故障知识结构化、标准化建模的重要价值,掌握了 BERT/RoBERTa 预训练模型、TF-IDF、语义相似度计算等关键技术的应用逻辑。

在工程实践层面,我独立完成了故障数据采集、文本预处理、知识抽取、知识图谱构建与初步检索算法设计等全流程工作。基于Neo4j 完成故障知识网络搭建,熟练掌握了数据清洗、术语归一、实体关系映射、Cypher 语句编写等工程化技能。在知识抽取与图谱构建过程中,不断优化流程、规范格式,切实提升了数据处理与工程落地的实践能力。

在问题解决层面,面对关系交叉重复、抽取效率低、数据整理繁琐、算法创新难度大等实际困难,我学会了拆解问题、查阅文献、对比方案与迭代优化。通过不断调整抽取策略、优化数据格式、改进相似度计算方法,逐步提升了故障知识建模与检索的稳定性和准确性,形成了严谨务实的科研思维与问题排查能力。

此外,本阶段工作也锻炼了我的项目统筹与时间规划能力。在数据处理、模型搭建、算法调试等多项任务并行推进的过程中,我能够合理安排进度、及时记录实验过程,为后续课题完善与系统开发积累了宝贵经验。

总体而言,本课题将自然语言处理、知识图谱、故障诊断与智能运维有机结合,显著提升了我的跨学科研究、编程实现与工程实践能力,也为后续完成算法优化、平台搭建与课题收尾奠定了坚实基础。