2个典型大数据分析案例,解析设备数据分析经典思路
2022-06-24 18:13:11
次
什么是大数据分析?大数据分析一般是指对规模巨大的数据进行分析,通过有组织有目的地收集数据,通过分析数据使之成为信息,从而在大量数据中寻找潜在规律以形成规则或知识的技术。伴随着大数据分析技术、数据库技术的日益发展、以数据挖掘为代表的数据分析技术正在被越来越多地应用于生产领域的各个方面。
尤其是在生产设备的故障预警,生产管控方面,近些年大数据分析更是得到了广泛的应用,下面我们就介绍2个经典的设备数据分析案例来诠释如何通过数据挖掘解决商业中遇到的问题。
1、通过Tempo DF(数据工厂平台)实现设备健康预警
某新能源公司正在建设的数据采集系统、,以CMS数据及离线数据作为输入,构建基于大数据分析、 模型开发,状态预警、监测展示于一体的设备健康状态预警大数据平台。基于现有的接入数据和业务规则库,快速构建数据处理流程。后期支持动态扩展接入数据、规则库动态变化后可以及时调整。降低工作成本的同时有效保障数据质量。实现与已有生产运维管理系统预警成果的共享和发布,降低设备故障发生概率,减少运维成本,提升公司整体运营收益。
整体的部署大致可以分为以下4个步骤
• 实时数据接入、数据清洗及数据标签生成。
• 根据输入的实时数据:包含时间戳、场站名称、机组名称、监测指标(500+个监测点位),基于数据质量规则构建函数,为采集数据增加“恒零值、恒非零值、正常值、异常值”标签,并计算异常数据占比。当数据质量规则库发生变化,下次统计时,该函数将按照最新的规则进行判断标记。实现动态获取数据质量规则。
• 模型构建及数据可视化功能设计开发及部署实施。
• 设备状态预警功能设计开发及部署实施。
值得注意的,实现方式通过原有的纯代码开发改为用数据工厂平台(TempoDF)实现后,企业可以轻松达成以下以下价值成效:
1.流程从设计到发布,人天成本缩短为原有的1/3;
2.执行效率由原有的执行一次花费3小时提升为现有的实时得到查询结果;
3.占用服务器资源也大大降低降低;
4.之前运维仅有数据管理员和研发人员能够维护,现有功能中业务人员即可轻松维护。
2、以数据挖掘技术实现设备运行风险逐层诊断
电网网架是能源输送和转换利用的网络枢纽,处于能源传输的中心环节。配电网10kV线路作为电网最贴近用户的环节,其运行状况会直接影响用户体验,进而影响电网公司的经济效益及社会责任实现的成效。其中配网线路重复跳闸是配网系统经常面对的问题之一,配网线路跳闸可能会威胁到配网的安全,对整个配网的服务用户都造成威胁,还可能带来多方面的隐患。
因为配网线路的跳闸原因比较复杂,所以要从各个方面着手分析,把造成重复跳闸原因找出来,并对未来线路发生跳闸概率进行预判,才可能更好的解决配网线路跳闸的问题,使整个网络平稳运行。
我们可以用线路单线图中变压器为节点对线路进行划分,形成不同的分段线路,对每段线路的运行风险概率进行预测。其次通过概率图模型构建基于网架拓扑结构的配网运行风险概率,并在网架拓扑结构上进行可视化展示。