基于改进GMM算法的综合能源数据清洗研究
DOI:
CSTR:
作者:
作者单位:

广西大学电气工程学院 南宁 530000

作者简介:

通讯作者:

中图分类号:

TP301.6

基金项目:


Research on comprehensive energy data cleaning based on improved GMM algorithm
Author:
Affiliation:

School of Electrical Engineering, Guangxi University,Nanning 530000, China

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对数据中台在采集数据过程中会产生异常值的问题,提出一种改进GMM算法的数据清洗方法。首先,将边缘计算引入来解决负载过大的问题;其次,为避免EM算法计算参数时陷入局部最优解,通过对GMM算法中的参数进行优化,改善了陷入局部最优解的缺点。实验结果表明,一定的数据量下,改进的GMM算法在召回率、F值等指标上均优于GMM-EM算法。由此可知,改进算法在一定程度上提高了对异常数据的清洗效果,保证数据的可靠性。

    Abstract:

    Aiming at the problem of outliers in the process of data collection, a data cleaning method based on improved GMM algorithm is proposed. Firstly, edge computing is introduced to solve the problem of excessive load. Secondly, in order to avoid falling into the local optimal solution when calculating the parameters of EM algorithm, the disadvantages of falling into the local optimal solution are improved by optimizing the parameters of GMM algorithm. The experimental results show that the improved GMM algorithm outperforms the GMM-EM algorithm in terms of recall and F value under a certain amount of data. It can be seen that the improved algorithm can improve the cleaning effect of abnormal data to a certain extent and ensure the reliability of data.

    参考文献
    相似文献
    引证文献
引用本文

杨柳林,胡贺骏.基于改进GMM算法的综合能源数据清洗研究[J].电子测量技术,2023,46(4):78-83

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2024-02-22
  • 出版日期:
文章二维码