学院首页 > 人才培养 > 本科生培养 > 通知公告 > 正文

【机情无限 精彩毕设】机械2026届毕业设计(论文)中期检查优秀案例分享第七期——基于机器学习的闪蒸焦耳热石墨烯制备工艺建模与优化

发布时间:2026.04.13 | 编辑: 李艳梅

学生姓名陈星儒

      能动2022-01班

指导教师钟巍

毕设题目基于机器学习的闪蒸焦耳热石墨烯制备工艺建模与优化

一、概况

1.选题意义

“双碳”战略与新材料强国政策指引下,石墨烯绿色低成本规模化制备成为产业突破重点。传统制备工艺存在能耗高、污染大、周期长、成本高、难以量产等问题,闪蒸焦耳热技术以毫秒级合成、无溶剂、低能耗、可利用固废碳源等优势,成为理想替代路线。但该工艺参数耦合性强、非线性特征显著,传统试错法难以厘清工艺–结构–性能关系,严重制约产业化进程。因此,我们选择将机器学习与闪蒸石墨烯技术结合,实现关键因子识别、性能精准预测与工艺自动优化。

2.任务分解

1)实验数据整理与数据集构建:选择173组实验数据,确定11个输入变量和16个输出变量,共27个参数。经过特征分析后,进行输入参数的筛选和重组,最终确定以电荷密度、原料种类、电流-时间曲线面积/质量、最大电流/质量、最终电流/最大电流为预测模型的输入参数。

2)机器学习预测模型搭建与评估:搭建线性回归、贝叶斯回归、随多层感知器、随机森林、决策树、XGBoost等多种机器学习回归模型,并采用决定系数与均方根误差完成模型评估与优选。

3)模型可解释性分析:通过特征重要性识别关键工艺参数,并通过分层随机森林验证关键参数的主导作用,最后通过偏依赖分析揭示参数影响规律。

4)工艺优化:最终设定以石墨烯产率为最大化目标,并用贝叶斯优化实现工参参数寻优。

二、已完成工作

1.数据集构建与特征工程

本研究的机器学习模型在基于Python的JupyterLab集成开发环境中进行开发、训练与评估。在完成库的导入和环境准备后,进行了数据的读取和初步探索。

为判断不同材料在高维特征空间中是否可区分、是否存在聚类结构,验证特征有效性,选取10个特征组成特征矩阵,在数据标准化后,先通过PCA降到6维,再通过t-SNE降到2维,最后绘制散点图,并按照材料类型着色。

如图1所示,4类不同材料(1:CB,2:MC,3:PA,4:TCB)的样本在特征空间中呈现清晰的分群与聚类,说明不同材料的样本具有显著可分性,证实了所选特征具有优异的材料类型判别能力,为后续的机器学习建模奠定了坚实的数据基础。

不同原料闪蒸石墨烯工艺特征的t-SNE降维可视化

2.拉曼指数与产率相关性分析

为探索拉曼指数(I2D/IGID/IGFWHM2D)与产率的相关性,以I2D/IG为横坐标、产率为纵坐标,分别用ID/IGFWHMD对散点着色,添加线性回归线及70%置信区间,计算皮尔逊相关系数(r)。

如图2所示,闪蒸焦耳热石墨烯制备I2D/IG与石墨烯产率存在强正相关关系(r=0.73),FWHM2DID/IG着色展示了结晶度和缺陷度的协同变化。结果表明,高I2D/IG(二维结构完整性)对应高产率,高I2D/IG、高产率的样品对应更大的FWHMD,这说明虽然高质量石墨烯(低FWHM2D)也能达到一定产量,但高产量的样品往往伴随着略高的FWHM 值,同时,低ID/IG(结构缺陷度)的产率波动较大,为闪蒸石墨烯的优化提供了量化参考。

石墨烯产率与I2D/IG的相关性分析

3.工艺参数与产率单变量相关性

为进一步考察了单个工艺参数对产率的影响,进行对Voltage,Mass,Capacitance,CD0等特征与FG Yield的回归分析,并计算皮尔逊相关系数,同时按照材料分组用不同标记和颜色展示散点。

如图3所示,外加电压(Voltage)与产率呈弱正相关r=0.44),电荷密度(CD0)与产率呈正相关(r=0.62),说明进行输入特征的重新组合,可更有效反应与产率的关系。电容(Cap)与产率的相关性较弱(r=0.19),不是关键的控制参数。而质量(Mass)与产率呈弱负相关(r=–0.41)。

不同实验参数与FG Yield的相关性分析散点图

4.不同材料性能统计对比

为了进一步进行材料筛选与工艺优化,通过箱线图比较了CBMCPATCB四种材料的性能差异。

如图4示,针对石墨烯产率,CB材料的中位数最高,且数据主要集中在75%-100%之间,表现出最高的产率潜力,MC材料的产率相对较低,分布较广,PATCB的产率处于中间水平,且分布较为离散。针对ImaxMC材料表现最显著,且数据点密集,CBTCB则表现较差,而PAImax则处于中间位置。针对IF/Imax,所有材料的该比率均较低,CBTCB有少量的异常高值点,MC的分布最为紧凑且数值最低。针对CDITMCPA该值较高,CBTCB的数值相对较低且分布较散,该趋势与Imax的趋势非常相似,说明这两个指标之间可能存在正相关关系。同时,该研究结果表明,在进行材料制备的过程中,需要根据具体场景选择合理的决策,需要做产率和电化学性能的平衡,如应用场景需要高功率或高储能,MC是更好的选择;如果应用场景主要看重产量和成本控制,CB可能更合适。

四种材料的产率与电化学活性参数统计分布

为清晰的对比四种材料在石墨烯产率上的差异,通过柱状图和误差线等统计学方法验证差异的显著性。如图5所示,明确了CB材料具有最高的产率优势,同时指出了MC材料的产率短板以及PA与TBC在产率表现无显著性差异,为材料筛选和性能权衡提供了关键的决策依据。

不同材料石墨烯产率的统计学对比分析

为进一步研究四种材料在石墨烯产率上的分布特性与稳定性,通过核密度估计曲线揭示了平均值背后的数据形态。如图6所示,直观呈现了CB材料不仅产率均值最高,且数据分布相对集中,表明其具备优异的高产率稳定性;MC材料虽然产率最低,但其分布曲线最为尖锐狭窄,揭示了其实验结果具有极高的一致性与可重复性;TCB材料分布形态与MC比较相似,只是整体偏右且峰值较高;而PA材料虽然平均产率居中,但其分布曲线最为扁平,暗示了该材料在产率表现上存在较大的波动性与不确定性。该图从数据离散度的角度,为评估材料在实际应用中的可靠性提供了关键依据。

四种材料的石墨烯产率核密度估计分布曲线

5.机器学习的建模

构建了三阶段机器学习模型预测石墨烯产率,首先使用线性回归对三个中间变量(IF/ImaxImaxCharge_Tot)拟合,得到四种材料的系数。采用XGBoost训练三个代理模型,以工艺参数(电荷密度、脉冲时间、预处理电压、材料系数),预测上述三个中间变量,将原始工艺参数、代理模型的预测值、热功率平方根等共12个特征输入六种回归器,预测石墨烯产率。

六种回归器(RF、XGBoostLR、BR、DT、MLP)的决定系数R2如9所示,其中XGBoost性能最佳(约0.64),且误差线最短,表明其预测精度高且结果稳定;随机森林和决策树次之,分数略低但表现仍优于其他模型。线性回归的R²最低,说明数据可能具有非线性特征,而其他如贝叶斯回归和MLP的得分处于中间水平,误差线也相对稍长。总体来看,基于树的集成模型(XGBoost、RF)在此任务中展现出了更强的拟合能力与稳定性。

7不同回归模型预测石墨烯产率的决定系数对比

  三、下一步工作计划

1. XGBoost等模型的参数调优

基于闪蒸焦耳加热实验数据集,选取线性回归、贝叶斯回归、多层感知机、决策树、随机森林及XGBoost共六类回归模型开展系统性参数调试。以石墨烯产率为预测目标,采用五折交叉验证划分训练集与测试集,通过网格搜索与随机搜索结合的方式,对学习率、树深度、正则化系数、网络层数等关键超参数进行迭代优化,有效降低模型过拟合风险。在调优过程中,以决定系数R²与均方根误差RMSE为核心评价指标,对比不同模型的拟合精度与泛化能力,最终确定最优模型结构与超参数组合,实现对石墨烯产率的稳定、精准预测。

2. 进行模型可解释性分析,明确工艺和产物的构效关系

XGBoost模型为基础,通过特征重要性评估、决策树提取与偏依赖分析,系统解析工艺参数对石墨烯产率的影响机制。定量计算电荷密度、原料类型、电流曲线特征等输入变量的贡献度,确定影响产率的关键控制因素;结合单变量与多变量偏依赖图,揭示电荷密度、电流密度等参数与产率之间的非线性关联,明确反应动力学从反应控制向扩散控制转变的临界条件。同时分析原料种类、电流随机波动等因素对产物结构的作用规律,建立完整的“闪蒸工艺石墨烯产率”构效关系,为工艺参数选择提供理论依据。

3. 进行贝叶斯优化,实现工艺的自动优化迭代

以最大化石墨烯产率为优化目标,搭建基于贝叶斯优化的工艺自动优化框架。选取电压、电容、样品质量等工艺参数为优化变量,以随机森林为代理模型,采用期望改善与增广期望改善为采集函数,实现参数空间的高效探索。完成多轮迭代后,对比随机参数方案与优化方案的产物性能差异,验证算法对工艺提升的有效性,最终实现无先验条件下废料原料向高品质闪蒸石墨烯的自动化、智能化制备。

问题一你是如何进行输入特征的筛选的?

回答采用经验预选和相关性剔除完成输入特征筛选。首先基于焦耳加热能量输入与电流传输机制,从实验参数中初步提取候选特征,通过Pearson相关性分析剔除高度冗余特征,避免多重共线性,最终筛选得到5个核心输入特征。

问题二怎样对这些机器学习模型进行超参数优化?

回答本研究对线性回归、贝叶斯回归、多层感知机、决策树、随机森林及XGBoost共6种回归模型实施统一的超参数优化流程。所有模型采用8:2训练测试划分与5折交叉验证,以决定系数R²为主要优化目标、均方根误差RMSE为辅助指标。对于XGBoost模型,重点对树深度、正则项、采样率等关键超参数进行网格搜索,通过交叉验证选择最优组合。

通过本阶段毕业设计的系统开展,我在专业知识、科研能力与实践技能上均取得了全面提升,收获颇丰。在理论学习层面,我深入掌握了闪蒸焦耳热制备石墨烯的核心原理、工艺特点与传统方法的技术瓶颈,系统学习了随机森林、XGBoost等机器学习回归模型、特征工程方法及贝叶斯优化算法的理论基础,深刻理解了数据驱动方法在材料工艺优化中的应用价值,进一步夯实了能源与材料交叉领域的专业知识体系。

在科研实践层面,我独立完成了数据集构建、特征提取、数据可视化分析与多模型建模训练,运用PythonJupyterLab平台开展数据处理与模型调试,提升了代码编写、数据分析与结果可视化的实操能力。通过对四种原料的性能对比、参数相关性分析与模型精度验证,我学会了严谨的科研逻辑与问题排查思路,能够独立分析实验规律、解读图表结果并总结科学结论。

同时,我也清晰认识到自身在模型调优、论文逻辑梳理与学术写作规范上的不足,明确了后续改进方向。这段经历让我体会到科研工作的严谨性与系统性,锻炼了独立思考、自主解决问题的能力,培养了耐心细致、持之以恒的科研态度,为后续论文完善与本科阶段学业收尾奠定了坚实基础,也为今后从事相关研究与工程实践积累了宝贵经验。