郑州大学网络空间安全学院佘维教授与田钊副教授团队在《郑州大学学报(理学版)》上发表题为:“基于贝叶斯优化极端梯度提升树的电缆状态分类研究”的研究型论文。
Cite: SHE Wei, WANG Xin, CHEN Bin, et al. Research on Cable Condition Classification Based on Bayesian Optimization of Extreme Gradient Boosting Tree[J]. Journal of Zhengzhou University(Natural Science Edition), 2025, 57(6): 1-7.
随着电力系统现代化进程的加速,电缆网络规模日益庞大且运行环境复杂,易出现缺陷或故障,给电力系统带来潜在威胁,及时准确地掌握电缆的运行状态成为当前发展的必然需求。此外,对电缆运行状态各项参数进行综合分析,提取核心指标,构建多维度风险评估模型,对电缆状态分类和评估具有深远的研究和应用价值。
基于机器学习的电缆状态监测已得到广泛应用,现有的电缆状态监测方法多基于大数据评估框架、概率神经网络、多状态量特征融合及长短时记忆网络等技术,虽在特征提取与数据融合方面取得了一定成效,但针对多分类问题中样本类间不平衡导致电缆状态分类准确性不高的问题未进行深入具体探讨。
本文针对这一不足,提出了一种基于贝叶斯优化极端梯度提升树(Bo-XGBoost)的电缆状态分类方法,旨在通过超参数自动寻优机制,缓解模型过拟合,为电缆状态监测提供一种高精度、高鲁棒性的新范式。
构建贝叶斯优化超参数自动寻优框架,创新性地引入贝叶斯优化算法替代传统的人工调参或网格搜索。利用高斯过程(Gaussian process, GP)作为代理模型,基于先验知识动态选择下一组超参数配置,有效解决了XGBoost算法在特定数据集上依赖经验调参、易陷入局部最优的难题。
提出Bo-XGBoost电缆状态分类模型,将优化后的超参数应用于极端梯度提升树(XGBoost),构建了Bo-XGBoost分类模型。该模型不仅继承了XGBoost处理高维数据和防止过拟合的优势,还通过贝叶斯优化进一步提升了模型的泛化能力。
融合交叉熵损失函数优化多分类性能,将电缆状态(class)分为轻度老化、中度老化和严重老化三大类,引入交叉熵损失函数作为评估指标。该函数能更精准地衡量预测概率分布与真实分布的差异,特别适用于处理样本类间不均衡问题,显著提升了模型对少数类(如严重老化)的识别能力。
本文在电缆状态分类方面提出基于Bo-XGBoost模型的分类方法,减轻了传统分类模型面临的过拟合问题。
首先对原始电缆数据集基于四个关键指标:运行时间、接地故障、局部放电以及介质损耗,进行标准化清洗与归一化处理,以消除不同量纲对模型训练的干扰。随后,将处理后的数据严格按照8:2的比例划分为训练集与测试集,为后续的模型训练与泛化能力验证奠定坚实的数据基础。
引入贝叶斯优化算法构建高斯过程代理模型,初始化超参数搜索空间。通过30轮迭代实验,以最小化交叉熵损失为目标函数,自动寻优并锁定最佳超参数组合。实验最终确定最优配置为:树的最大深度(max_depth)为8,学习率(learning_rate)为0.04325,有效避免了人工调参的盲目性。
将优化所得的最优参数代入XGBoost算法进行模型训练,构建最终的Bo-XGBoost分类器。为了验证该方法的有效性,将其与SVM、TabNet、LightGBM等主流基准算法进行多维度对比,实验结果证明该模型在电缆状态分类任务中具有显著的精度优势与鲁棒性。

图1 Bo-XGBoost模型算法流程图。该图清晰展示了从初始化目标函数、建立高斯过程模型,到选择实验点、评估交叉熵损失,直至更新模型并输出最优参数的完整闭环优化过程,直观体现了贝叶斯优化与XGBoost的深度融合机制。
表1 各分类算法模型准确率和召回率对比
数据显示,Bo-XGBoost模型的准确率达到88.29%,显著优于XGBoost(81.67%)、LightGBM(80.00%)及SVM(65.00%)。在召回率方面,该模型更是达到了93.98%,证明其在识别电缆各类老化状态(尤其是易被忽略的严重老化状态)方面具有极强的鲁棒性。
图2 Bo-XGBoost优化迭代曲线。
展示了模型在30轮迭代过程中准确率的变化趋势。曲线表明,经过13次迭代后模型准确率趋于稳定并达到峰值(0.883),验证了贝叶斯优化算法能够以较少的迭代次数高效锁定全局最优解,大幅提升了计算效率。
第一作者:佘维 教授
郑州大学 网络空间安全学院
研究方向:复杂系统建模与仿真、机器学习、区块链与数据智能研究
E-mail:wshe@zzu.edu.cn
通信作者:田钊 副教授
郑州大学 网络空间安全学院
研究方向:群体智能、机器学习、区块链与数据智能研究
E-mail:tianzhao@zzu.edu.cn
引用格式:
佘维, 王欣, 陈斌, 等. 基于贝叶斯优化极端梯度提升树的电缆状态分类研究[J]. 郑州大学学报(理学版), 2025, 57(6): 1-7.
SHE Wei, WANG Xin, CHEN Bin, et al. Research on Cable Condition Classification Based on Bayesian Optimization of Extreme Gradient Boosting Tree[J]. Journal of Zhengzhou University(Natural Science Edition), 2025, 57(6): 1-7.
扫描上方二维码,或点击文末“阅读原文”查看文献。
https://html.rhhz.net/ZZDXXBLXB/html/20250601.htm