MixIOT中的基础数据分析应用及其使用(二):偏态估计值

2024-07-01 11:37
在MixIOT的基础数据分析应用中,很多都是用于计算估计值的,包括偏态估计值、稳定性估计值、平衡估计值、增量估计值和风险估计值。这些估计值应用,是通过测量数据样本,对物联网对象进行不同侧面的定量推算,在对它们进行逐一介绍之前,有必要先解释一下什么是数据样本。
估计值与数据样本

还是以空压机气站为例,假设我们已经在MixIOT平台上,创建了标识为OBJ881的空压机气站站对象,该对象有多个变量参数,分别是三台空压机的加载状态、产气压力、产气量、电度表读数,两个储气罐的温度和压力,以及整个气站的供气压力和流量。

图片

空压机气站采集到的变量参数

假设,在某一个时间点,该对象通过映射关系,获得了一组所有变量的数据,这些数据对应的都是该对象相关实体的实时数据,这组数据被称为是在该时间点的测量值。下一个时间点,该对象又有了一组新的测量数据。为方便起见,我们总是把最新的数据放在最上面。这样,新的测量数据不断生成,经过一段时间后就获得了该对象的很多组这样的测量数据。

该时段内所有的这些测量数据,构成了该时间段的测量数据样本。之所以称它们是样本,是因为这些测量数据在时间上都是间隔测量的。尽管如此,这些测量数据样本可以代表空压站在这个时间段的实际状态,就能用于相关的推算。
图片
对象在某个时间段内的测量数据样本
偏态估计值的概念

下面我们正式进入偏态估计值的介绍。

偏态估计值,就是物联网对象在某个时间段的实际状态与标准状态(也称为期望状态)之间偏离程度的估算。这里的实际状态,就是前面说的这个时间段的测量数据样本。简单的说,就是用实际测量的数据样本来估算对象在这个时间段,实际与理想之间的偏差有多大。

然而,要正确理解什么是偏态,却不是很容易。我们尝试用一个大家都熟悉的例子,看看能不能把它解释清楚。

一辆小车正在一条规定速度60公里的公路上行驶(为便于理解,我们将60公里作为规定速度而不是最高或最低限速),从A地开往B地,总里程10公里,用适配器记录下整个过程的行车速度。在这个例子中,60公里的时速,就是标准状态或者期望状态,需要注意的是,这是交通管理部门所期望的行驶速度,并非小车司机所能完全做到的速度。因为车是由司机人为在操控,很难保持绝对匀速行驶。

下图是该路段全程的行车速度数据曲线,纵轴代表的是速度,横轴代表的是道路的路程刻度。在时速60公里处,做一条标签,假设只要小车的时速不是60公里都算偏态,用红色把有偏态的部分标出来。这时候我们可以看到,整条道路从头到尾,几乎全部都是偏态,如果交警以此作为违章依据去开罚单,显然是不合理的。

图片

车辆行驶全程中与规定时速的偏差
事实上,交通违章多半都会留有余地,在这个例子中假设只要小车行驶速度的上下浮动不超过规定速度的10%,就不会认定是违章,按照这个条件,小车在整个路段中也有违章,用红色标注出来。如果交警把超速10%和速度低于10%都当做违章开罚单,那么小车司机就会被罚两次,一次开得太快,一次开得太慢。所以,该道路的期望状态,实际上是一个速度区间范围,这个速度的区间范围,就是标准状态或者期望状态。只有超出这个标准状态或期望状态的时候,才会被认定为是违章,也就是出现了偏态。

图片

车辆行驶全程中的偏态

所以,标准状态或期望状态,本质上是一个事实依据。在这个例子中,这个依据就是交警是否认定违章,是否开具罚单。

根据这个例子,我们总结一下,给出偏态估计值的相关概念。

第一,标准状态或期望状态,是针对某个确定的过程或时段的。在这个小车行驶的例子中,如果小车离开了这个路段到了另一个路段,那么,60公里正负10%这个期望状态就不存在了。也就是说,这个60公里时速只适用于这条10公里的路段。
第二,标准状态或期望状态,是一个容错区间,也就是说,虽然有一个限速牌,但事实上交警执法的时候,会有一个正负10%的宽限度,这个就是容错区间。
第三,这个容错区间,可以大也可以小,取决于具体的场景和规则。
第四,某些时候,容错区间也可能是零区间,这就是所谓的零容忍。

第五,偏态估计值,就是对象的实际状态相对于标准状态或期望状态的偏离程度的估算

我们进一步假设,小车司机开的是公司的车,公司的老板对他也提出了一个要求,行驶这条10公里路段的油耗是0.75升,超出这个油耗就要小车司机自己掏钱。但老板也给出了10%上下浮动的宽限。那么,这条路段的标准状态或者期望状态就有了两个,一个是行驶速度,一个是油耗。

图片

包括时速和油耗两个期望状态因素的行驶情况

事实上我们并无法在小车行驶过程中,实时获得每一个瞬间的油耗,只能是在小车到达B地后,看看这段10公里的路程实际用了多少油。这样,就可以来进一步完善偏态估计值的相关概念:

第六,标准状态或期望状态,可以包括对象的多个因素

第七,描述对象实际状态,可以是过程中的测量数据样本,就像小车行驶速度,也可以是过程结束时候的测量数据,就像小车行驶结束后的油耗,具体使用什么样的数据样本要根据实际需要来定。

现在,我们就应该清楚,要得到偏态估计值需要怎么做:
首先,要确定估计的对象是什么。
第二,要确定描述标准状态或期望状态的因素都有哪些。
第三,要确定标准状态或期望状态的容错区间。
第四,要确定偏态估计的过程或时段。

第五,要确定使用对象在该过程或时段中的哪些测量数据样本。

最后,当然就是创建项目,把剩下的事情交给偏态估计值应用去做。
偏态估计值的使用示例

下面我们通过示例来讲解偏态估计值应用的使用方法,还是以上面的空压机气站(OBJ881)为例。

图片

压机气站(OBJ881)
首先来构建空压机气站供气压力偏态估计值,根据前面的讲解,我们逐个确定以下这些关键信息:
  • 偏态估计值对象是整个空压机气站;
  • 需要用到的变量参数是S101,也就是整个气站的供气压力;
  • 根据一般经验,标准状态的区间是1.05-1.15Mpa;
  • 过程或时段是1个小时,每小时计算1次该时段或过程的全部测量数据样本。

这个项目创建完成后,偏态估计值应用的计算模型就会根据项目的配置和所使用的测量数据样本,每小时计算一次,每次计算都会产生一条偏态估计值的计算结果,而每条偏态估计值的计算结果所计算的,都是最近一小时这个时段里,空压机气站这个对象的供气压力偏态估计。点击估计值图表链接,就可以查看估计值图表。
图片

空压机气站供气压力偏态估计值的计算图表

现在来看另一个偏态估计值项目:气站总气电比偏态估计值,我们依然需要确定以下这些关键信息:
  • 偏态估计值对象是整个空压机气站;
  • 需要用到的变量参数是整个气站的气电比指数;
  • 标准状态的区间是0.1-0.12;
  • 过程或时段是1个小时,每小时计算1次该过程或时段结束时的最后一个数据。

这些信息看似与供气压力偏态估计值差不多,但其实有几个重要的区别。

第一,气站总气电比偏态估计值所需要用到的气电比指数这个变量参数不是直接从设备中采集到的,而是经过运行指数应用计算后产生的,是这个空压机气站对象的扩展变量。从这里可以看出,MixIOT对象通过采集得到的柔性变量和通过计算得到的扩展变量,都可以被任何其他一个应用引用,这就是为什么MixIOT是一个灵活的体系。

第二,选择的数据样本是过程或时段结束时候的数据样本而不是全部数据,其实MixIOT在估计值的数据样本选择上是非常灵活的,除了这两个例子中使用的全部数据样本和结束时的数据样本外,还可以根据实际需求选择开始时的数据样本、数据样本平均值、最大数据样本、最小数据样本、数据样本的中位数、全部数据样本的数值积分、全部数据样本的数值转用量等等。

第三,气站总气电比偏态估计值的输出是有限制的,由于总气电比指数是气站总耗电量与总产气量的比值,当总产气量(即变量参数S102)为零时,就不计算偏态,因为这个时候气电比指数计算公式中的分母为零,算不出结果。这样的限制在脚本编写时有相应的表达方法。

此外,在这两个例子中使用的标准状态都是区间,而MixIOT还支持零区间(即零容忍)、正态分布、泊松分布或核密度分布等标准状态。

那么,偏态估计值有什么意义呢?事实上,所有的估计值都是一种具有特定含义的指数,只不过它们的构造是确定的偏态估计值,也就是用来衡量实际状态与标准状态偏离程度的指数,偏态估计值本身也是个相对数,单独一个偏态估计值并没有什么意义,重要的是估计值的变化,如果越变越大,说明对象实际状态与标准状态的偏离程度越来越大,也就意味着在实际的工业生产中已经出现或可能出现相应的问题,偏态估计值对于我们及早发现并解决这些问题具有十分重要的作用。

前期回顾 (点击内容即可前往阅读)

1

MixIOT中的基础数据分析应用及其使用(一):运行指数

2

技术干货丨⼯业物联网场景与对象的深度解读

3

为什么说MixIOT是精于数据分析的工业互联网平台?

4

AOA体育·(中国)官方网站MixIOT的产品逻辑



---THE END---