一种新能源电源测试数据管理方法及系统与流程
未命名
08-03
阅读:97
评论:0

1.本技术涉及新能源电源测试数据管理技术领域,具体涉及一种新能源电源测试数据管理方法及系统。
背景技术:
2.现阶段新能源可以分为太阳能、风能、生物质能、化工能、核能等多个类别,目前对于汽车行业,也逐步开始迈入新能源领域,汽车能源采用新能源电池。新能源电池是指以可再生能源为主要能源的电池,新能源电池可以分为锂离子电池、电池(磷酸铁锂)、锰酸锂电池等,新能源电池具有高能量密度、较低的传输损失、较高安全性的特点,目前广泛应用在光伏发电、新能源汽车等行业。
3.为保证新能源电池的安全、高效的使用,需要对新能源电池进行多方面的检测,新能源的检测包括电压检测、电流检测、短路测试、防爆安全测试、冲击测试等。在利用测试仪器进行实际测试过程中,由于新能源电池的特殊性质,测量数据容易产生较大的误差,通过测量数据计算新能源电池的相关数据也会产生偏差,影响对新能源电池测试结果评估的准确率。因此需要对新能源电池的测试数据进行有效管理,通过对测试数据的检测管理,便于后续基于正常的测试数据得到新能源电池各项检测的精确测试结果。现阶段的数据管理包括异常数据检测、数据分类等,不同方法对测试数据的管理效果不同,例如基于lof算法的异常数据检测运算效率低且需要人为设置相关参数,基于optics算法的数据分类不适合多密度的数据,很难保证新能源电池的测试数据符合要求。
技术实现要素:
4.本技术实施例提供一种一种新能源电源测试数据管理方法及系统,能够对测量数据进行管理,提高测量数据的可靠程度,便于后续基于正常的测试数据得到新能源电池各项检测的精确测试结果。
5.第一方面,本技术实施例提供了一种新能源电源测试数据管理方法,所述方法包括:采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据;基于所述数据序列内多维度的测试数据的分布情况构建测试数据密度;基于所述测试数据密度得到初始聚类中心;根据每个时刻的测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到测试数据的聚类结果;基于测试数据的聚类结果,对测试数据进行分区存储管理,所述分区存储管理是指将合格数据和不合格数据分区存储管理。
6.在本技术的部分实施例中,所述采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据
的步骤,包括:利用多种传感器分别采集电池在测试过程中的多种测试数据;通过均值填充算法对多种测试数据进行计算,得到电池在测试过程中每一时刻的数据序列;所述多维度的测试数据包括电压、温度、电量、电流四个维度的测试数据。
7.在本技术的部分实施例中,所述基于所述数据序列内多维度的测试数据的分布情况构建测试数据密度的步骤,包括:根据所述数据序列内多维度的测试数据之间的影响关系,对数据序列中每个维度的测试数据按照从小至大的顺序排序;获取测试数据中每一维度所包含的数据量,得到每一维度各自的统计直方图,所述统计直方图中的横坐标表示同一种维度的测试数据的不同取值,纵坐标表示对应取值所包含的数据量;依据所述统计直方图计算出测试数据密度。
8.在本技术的部分实施例中,所述依据所述统计直方图计算出测试数据密度的公式为:为:为:其中,是t时刻数据序列中第j维数据的分布比值,是t时刻数据序列中第j维数据在统计直方图中对应的数据量,是数据序列的总数量,是统计直方图对应的信息熵,是数据序列中的维度数量;是t时刻、t+1时刻的测试波动指数,、分别是t时刻、t+1时刻数据序列所对应的分布比序列,所述分布比序列是由数据序列中每个数据的分布比值组成的,其中是指t时刻数据序列中第一维度数据的分布比值,是分布比序列、之间的dtw距离;是t时刻的测试数据密度,是t-1时刻、t时刻的测试波动指数,是所有测试波动指数中的最大值。
9.在本技术的部分实施例中,所述基于所述测试数据密度得到初始聚类中心的步骤,包括:获取每个时刻所对应的测试数据密度;利用k-means聚类算法对所有时刻的测试数据密度进行聚类,聚类过程中的度量距离为两个测试数据密度的差值;计算每个聚类簇中测试数据密度的均值,将均值中最大值所在聚类簇中的测试数据密度对应时刻的数据序列作为后续测试数据聚类的初始聚类中心。
10.在本技术的部分实施例中,所述根据每个时刻的测试数据密度、数据序列以及初
始聚类中心,并通过算法修正聚类中心,得到测试数据的聚类结果的步骤,包括:根据每个时刻的测试数据密度、数据序列以及初始聚类中心获取每个时刻数据序列的k近邻集合,并根据k近邻集合得到整个充电测试过程中每个时刻的k-dist图,所述k-dist图中的横坐标是每个时刻的数据序列与其第k个近邻的数据序列之间的度量距离,纵坐标是每个度量距离中包含数据序列的数量;依据每个时刻的k-dist图,构建类内修正距离,用于表征不同时刻数据序列对其所在聚类簇的聚类中心的修正程度;依据所述类内修正距离改进迭代自组织聚类isodata算法,得到测试数据的聚类结果。
11.在本技术的部分实施例中,以t时刻为例,所述k近邻集合的计算公式为:在本技术的部分实施例中,以t时刻为例,所述k近邻集合的计算公式为:其中,是t时刻与第z个初始聚类中心的中心距离,、分别是t时刻、初始聚类中心z的数据序列,是数据序列、之间的dtw距离,、分别是t时刻、初始聚类中心z的测试数据密度;是t时刻与t+1时刻的异簇距离,是t+1时刻与第z个初始聚类中心的中心距离,是初始聚类中心的数量;分别计算t时刻与其余所有时刻的异簇距离,将异簇距离按照从小到大的顺序进行排序,取排序结果的前k个时刻作为t时刻的k近邻集合。
12.在本技术的部分实施例中,所述依据每个时刻的k-dist图,构建类内修正距离的公式为:公式为:其中,是t时刻与初始聚类中心z的第j维差值,是第j维数据的信息增益,g是所有采集数据的集合,、分别是t时刻与初始聚类中心z的第j维数据值;是t时刻对初始聚类中心z的类内修正距离,是数据序列中的维度数量,、分别是t时刻与初始聚类中心z的k-dist图,是、之间的巴氏距离,是调参因子。
13.在本技术的部分实施例中,所述依据所述类内修正距离改进迭代自组织聚类isodata算法,得到测试数据的聚类结果的步骤,包括:根据所述类内修正距离获取迭代自组织聚类isodata算法中的聚类中心修正过程,计算初始聚类中心,计算公式为:
其中,是聚类过程中初始聚类中心z的更新结果,、分别是t时刻的数据序列、类内修正距离,是初始聚类中心z对应聚类簇中的数据量。
14.第二方面,本技术提供了一种新能源电源测试数据管理系统,包括:传感器模块,用于采集电池测试过程中产生的测试数据;预处理模块,用于接收传感器模块发送过来的测试数据,并对测试数据进行预处理,以得到每一时刻所对应的具有多种维度的数据序列;密度构建模块,用于基于数据序列内不同维度数据的分布情况构建测试数据密度,并基于测试数据密度得到初始聚类中心;根据每个时刻的k近邻集合得到对应的k-dist图,并基于k-dist图构建类内修正距离;聚类模块:用于根据类内修正距离改进迭代自组织聚类isodata算法,并根据测试数据的聚类结果对测试数据进行分区存储管理;存储管理模块:用于对聚类模块发送过来的测试数据进行分区存储管理,即将属于同一类别的测试数据存储在同一区域,并为每个区域分配一个唯一标识符。
15.由此可知,本技术实施例主要是通过对电池测试过程中所采集到的测试数据进行预处理,得到每一时刻的数据序列,通过数据序列内不同维度数据的分布情况构建测试数据密度,测试数据密度考虑了每个时刻与相邻时刻的数据波动情况以及不同维度数据的信息熵,能够有效避免因不同的电池处在测试过程中不同阶段所产生的数据差异,而导致在区分异常测试数据和正常测试数据时,形成干扰误差,有利于提高后续测试数据聚类精度。进一步地,通过根据测试数据的聚类结果,对测试数据进行分区存储管理,将合格数据和不合格数据分区存储管理,有利于提高测试数据的检索效率和利用率,便于后续对测试数据进行分析和评估,尽可能提高电池筛选的正确率。
附图说明
16.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例所提供的一种新能源电源测试数据管理系统的示意图;图2为本发明实施例方案涉及的硬件运行环境的系统示意图;图3为本发明实施例提供的一种新能源电源测试数据管理方法的流程示意图;图4为本发明实施例所提供的电池在t时刻的k-dist图。
具体实施方式
18.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于
本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
19.请参见图1,本技术提供了一种新能源电源测试数据管理系统,其主要是对电池测试数据进行处理管理的系统,以使测试数据经过处理管理后,能够更加精准地判定电池属于合格产品还是不合格产品,并将电池对应的测试数据信息分区存储,以便后续检索和分析。对于该系统,包括:传感器模块,用于采集电池测试过程中产生的测试数据;预处理模块,用于接收传感器模块发送过来的测试数据,并对测试数据进行预处理,以得到每一时刻所对应的具有多种维度的数据序列;密度构建模块,用于基于数据序列内不同维度数据的分布情况构建测试数据密度,并基于测试数据密度得到初始聚类中心;根据每个时刻的k近邻集合得到对应的k-dist图,并基于k-dist图构建类内修正距离;聚类模块:用于根据类内修正距离改进迭代自组织聚类isodata算法,并根据测试数据的聚类结果对测试数据进行分区存储管理;存储管理模块:用于对聚类模块发送过来的测试数据进行分区存储管理,即将属于同一类别的测试数据存储在同一区域,并为每个区域分配一个唯一标识符。
20.通过上述各模块之间的配合作用,对电池的测试数据进行精度处理,提高电池的测试数据精度,继而对电池的准确管理提供精准的数据依据,并对各电池的所得到的测试数据进行分区管理,便于后续数据的检索和分析。
21.请参见图2,图为本技术实施例方案涉及的硬件运行环境的系统的结构示意图。
22.如图2所示,该系统可以包括:处理器1001,例如中央处理器1001(centralprocessing unit,cpu),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display),可选用户接口1003还可以包括标准的有线接口以及无线接口,而用户接口1003的有线接口在本发明中可为通用串行总线(universal serial bus,usb)接口。网络接口1004可选的可以包括标准的有线接口以及无线接口(如wi-fi接口)。存储器1005可以是高速随机存取存储器1005(random access memory,ram);也可以是稳定的存储器1005,比如,非易失存储器1005(non-volatile memory),具体可为,磁盘存储器1005。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
23.本领域技术人员可以理解,图中示出的结构并不构成对系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
24.如图2所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及新能源电源测试数据管理程序。
25.在图2所示的系统中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设;所述系统通过处理器1001调用存储器1005中存储的新能源电源测试数据管理程序,并执行本发明实施例提供的新能源电源测试数据管理方法。
26.请参照图3,图3为本发明实施例提供的一种新能源电源测试数据管理方法的流程示意图,所述方法包括以下步骤:
s1、采集电池测试过程中的测试数据,并对测试数据进行预处理,得到每一时刻所对应的数据序列,数据序列包括多维度的测试数据;s2、基于数据序列内多维度的测试数据的分布情况构建测试数据密度;s3、基于测试数据密度得到初始聚类中心;s4、根据每个时刻的测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到测试数据的聚类结果;s5、基于测试数据的聚类结果,对测试数据进行分区存储管理,分区存储管理是指将合格数据和不合格数据分区存储管理。
27.本技术实施例主要是通过对电池测试过程中所采集到的测试数据进行预处理,得到每一时刻的数据序列,通过数据序列内不同维度数据的分布情况构建测试数据密度,测试数据密度考虑了每个时刻与相邻时刻的数据波动情况以及不同维度数据的信息熵,能够有效避免因不同的电池处在测试过程中不同阶段所产生的数据差异,而导致在区分异常测试数据和正常测试数据时,形成干扰误差,有利于提高后续测试数据聚类精度。进一步地,通过根据测试数据的聚类结果,对测试数据进行分区存储管理,将合格数据和不合格数据分区存储管理,有利于提高测试数据的检索效率和利用率,便于后续对测试数据进行分析和评估。
28.对于步骤s1,需要说明的是,采集电池测试过程中的测试数据主要是通过传感器实现,对于测试数据的采集,包括多维度的测试数据,如电压数据、温度数据、电量数据以及电流数据等,这类维度的数据均与电池的合格与否相关。对应地,传感器也包括多种类型的传感器,主要与所测试的数据类型对应,如包括电压传感器、电流传感器、电量传感器以及温度传感器等。为本领域技术人员更好地理解s1步骤,下面对s1步骤进行举例说明:所述采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据的步骤,包括:利用多种传感器分别采集电池在测试过程中的多种测试数据;通过均值填充算法对多种测试数据进行计算,得到电池在测试过程中每一时刻的数据序列;所述多维度的测试数据包括电压、温度、电量、电流四个维度的测试数据。
29.利用相关传感器采集电池(磷酸铁锂)进行充电测试时的数据,其中充电测试的数据包括电压、温度、电量、电流,所述传感器包括电压传感器、电流传感器、温度传感器和电量传感器,将进行充电测试的电池(磷酸铁锂)数量记为n个,每个电池(磷酸铁锂)采集m个数据,相邻两次数据采集的时间间隔为2s,为避免采集过程中网络波动等因素造成的数据丢失,利用均值填充算法对采集数据进行预处理,均值填充算法为公知技术,具体过程不再赘述。
30.每个电池(磷酸铁锂)的每个采集时刻的测试数据组成数据序列x,测试过程中第a块电池(磷酸铁锂)t时刻的数据序列记为,其中,、、、分别是第a块电池(磷酸铁锂)测试过程中t时刻的电压、温度、电量、电流。至此,得到电池(磷酸铁锂)充电测试中每个时刻的数据序列。
31.对于步骤s2,所述基于所述数据序列内多维度的测试数据的分布情况构建测试数
据密度的步骤,包括:s21、根据所述数据序列内多维度的测试数据之间的影响关系,对数据序列中每个维度的测试数据按照从小至大的顺序排序;s22、获取测试数据中每一维度所包含的数据量,得到每一维度各自的统计直方图,所述统计直方图中的横坐标表示同一种维度的测试数据的不同取值,纵坐标表示对应取值所包含的数据量;s23、依据所述统计直方图计算出测试数据密度。
32.下面对步骤s21至步骤s23进行详细说明:每块电池(磷酸铁锂)测试过程中的状态可能是不同的,每个数据序列中采集数据之间的关系也不是稳定的。例如对于数据序列中的电压和电量而言,电池(磷酸铁锂)的电量和电压并不是线性关系,仅通过充电测试中采集的电压值无法精准的计算电池(磷酸铁锂)的电量。因为在测试过程中,电池电量的变化还涉及到了电池的温度、自放电、老化等的因素。例如,随着温度的降低,电解液的离子电导率随之降低,sei膜电阻和电化学反应电阻随之增大,导致低温下欧姆极化、浓差极化和电化学极化均增大,在电池(磷酸铁锂)的放电曲线上就表现为电压和放电容量均随着温度降低而降低;反之随着温度逐渐升高,电池(磷酸铁锂)的电压和放电容量会逐渐增大。
33.因此对于每个采集时刻的数据序列而言,会因为处于充电测试的不同阶段导致数据序列中的数据的大小处于动态变化的状态,很难通过数据的大小反映数据序列是否为测试过程中异常数据。但是数据之间的影响关系是相对稳定的,因此每个数据序列中每个维度的采集数据按照从小到大的顺序排序,其次获取每个维度排序结果的统计直方图,将第j维数据的统计直方图记为,所述每个维度是指数据序列中每个类型的采集数据。例如对于电压数据而言,统计直方图中的横坐标是电压的不同取值,纵坐标是不同电压取值所分别对应包含的数据量。
34.基于上述分析,此处构建测试数据密度v,用于表征测试过程中不同时刻下测试数据之间的分布关系,计算t时刻的测试数据密度:::式中,是t时刻数据序列中第j维数据的分布比值,是t时刻数据序列中第j维数据在统计直方图中对应的数据量,是数据序列的总数量,是统计直方图对应的信息熵,是数据序列中的维度数量,本发明中的大小取经验值4。的值越小,t时刻数据序列中第j维数据在整个测试过程中出现的比例越小。
35.是t时刻、t+1时刻的测试波动指数,、分别是t时刻、t+1时刻数据序列
所对应的分布比序列,所述分布比序列是由数据序列中每个数据的分布比值组成的,例如,其中是指t时刻数据序列中第一维度数据的分布比值,是分布比序列、之间的dtw距离,dtw距离为公知技术,具体过程不再赘述。的值越大,t时刻和t+1时刻测试数据的波动程度越大。
36.是t时刻的测试数据密度,是t-1时刻、t时刻的测试波动指数,是所有测试波动指数的最大值。
37.测试数据密度反映了充电测试过程中不同时刻下测试数据之间的分布关系。t时刻数据序列中第j维数据在整个充电测试过程中出现的次数越小,的值越小,整个充电测试过程中第j维数据的取值范围越大,的值越大,的值越大;充电测试过程中t时刻和t+1时刻测试数据的变化程度越大,处于充电测试过程中不同阶段的可能性越大,分布比序列、之间的差异越大,的值越大,的值越大;t时刻与相邻时刻的数据序列差异越大,的值越大,即的值越大,t时刻数据序列中采集数据的局部密度越小。测试数据密度考虑了每个时刻与相邻时刻的数据波动情况以及不同维度数据的信息熵,其有益效果在于能够避免不同电池(磷酸铁锂)由于处在测试过程中不同阶段的数据差异在区分异常测试数据和正常测试数据的干扰误差,有利于提高后续测试数据聚类精度。
38.对于步骤s3,所述基于所述测试数据密度得到初始聚类中心的步骤,包括:s31、获取每个时刻所对应的测试数据密度;s32、利用k-means聚类算法对所有时刻的测试数据密度进行聚类,聚类过程中的度量距离为两个测试数据密度的差值;s33、计算每个聚类簇中测试数据密度的均值,将均值中最大值所在聚类簇中的测试数据密度对应时刻的数据序列作为后续测试数据聚类的初始聚类中心。
39.下面对步骤s3进行详细说明:通过前述的步骤s1和s2获取每个时刻的测试数据密度,利用k-means聚类算法对所有时刻的测试数据密度进行聚类,聚类过程中的度量距离为两个测试数据密度的差值,k的大小取经验值10,k-means聚类为公知技术,具体过程不再赘述,其次计算每个聚类簇中测试数据密度的均值,将均值最大值所在聚类簇中的测试数据密度对应时刻的数据序列作为后续测试数据聚类的初始聚类中心。
40.至此,得到每个时刻测试数据的测试数据密度以及测试数据聚类的初始聚类中心。
41.对于步骤s4,所述根据每个时刻的测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到测试数据的聚类结果,包括:s41、根据每个时刻的测试数据密度、数据序列以及初始聚类中心获取每个时刻数据序列的k近邻集合,并根据k近邻集合得到整个充电测试过程中每个时刻的k-dist图,所述k-dist图中的横坐标是每个时刻的数据序列与其第k个近邻的数据序列之间的度量距
离,纵坐标是每个度量距离中包含数据序列的数量;s42、依据每个时刻的k-dist图,构建类内修正距离,用于表征不同时刻数据序列对其所在聚类簇的聚类中心的修正程度;s43、依据所述类内修正距离改进迭代自组织聚类isodata算法,得到测试数据的聚类结果。
42.下面对s4步骤进行详细说明:获取每个时刻的测试数据密度,利用k-means聚类算法对所有时刻的测试数据密度进行聚类,聚类过程中的度量距离为两个测试数据密度的差值,k的大小取经验值10,k-means聚类为公知技术,具体过程不再赘述。然后计算每个聚类簇中测试数据密度的均值,将均值最大值所在聚类簇中的测试数据密度对应时刻的数据序列作为后续测试数据聚类的初始聚类中心。
43.至此,得到每个时刻测试数据的测试数据密度以及测试数据聚类的初始聚类中心。
44.请参见图4,根据每个时刻的测试数据密度、数据序列以及初始聚类中心获取每个时刻数据序列的k近邻集合,并根据k近邻集合得到整个充电测试过程中每个时刻的k-dist图,t时刻的k-dist图记为。k-dist图中的横坐标是每个时刻的数据序列与其第k个近邻的数据序列之间的度量距离,纵坐标是每个度量距离中包含数据序列的数量。t时刻的k近邻集合的获取过程如下:邻集合的获取过程如下:式中,是t时刻与第z个初始聚类中心的中心距离,、分别是t时刻、初始聚类中心z的数据序列,是数据序列、之间的dtw距离,、分别是t时刻、初始聚类中心z的测试数据密度。
45.是t时刻与t+1时刻的异簇距离,是t+1时刻与第z个初始聚类中心的中心距离,是初始聚类中心的数量。
46.分别计算t时刻与其余所有时刻的异簇距离,将异簇距离按照从小达到的顺序进行排序,取排序结果的前k个时刻作为t时刻的k近邻集合,k的大小取经验值7。
47.进一步的,获取所有时刻的k-dist图,在迭代自组织聚类isodata算法对聚类中心的修正过程中,仅考虑了样本点与聚类中心的欧式距离,然而在充电测试过程中,同一块电池(磷酸铁锂)在不同时刻的数据序列会存在一定差异,不同块电池(磷酸铁锂)由于生产过程或者运输过程中的不稳定性也会存在差异。例如,如果电池(磷酸铁锂)在生产过程中化学材料的使用没有达到标准,则电池(磷酸铁锂)内部发生正负极材料表面膜层变化、金属异物的溶解与析出等副反应会导致电池(磷酸铁锂)发生自放电,除此之外,正负极之间隔膜造成的电池(磷酸铁锂)内部的微短路导致电池(磷酸铁锂)的自放电。因此,本发明基于k-dist图对迭代自组织聚类isodata算法中的聚类中心修正过程进行改进。
48.基于上述分析,此处构建类内修正距离c,用于表征不同时刻数据序列对其所在聚类簇的聚类中心的修正程度,计算t时刻对初始聚类中心z的类内修正距离::式中,是t时刻与初始聚类中心z的第j维差值,是第j维数据的信息增益,g是所有采集数据的集合,信息增益为公知技术,具体过程不再赘述。、分别是t时刻与初始聚类中心z的第j维数据值,的值越大,t时刻与初始聚类中心z的差异越大。
49.是t时刻对初始聚类中心z的类内修正距离,是数据序列中的维度数量,本发明中的大小取经验值4,、分别是t时刻与初始聚类中心z的k-dist图,是、之间的巴氏距离,是调参因子,的作用是防止分母为0,的大小取经验值0.01。
50.类内修正距离反映了不同时刻数据序列对其所在聚类簇的聚类中心的修正程度。当t时刻数据序列中在第j维的测试数据与其所在聚类簇的初始聚类中心z的第j维测试数据的差值越大,的值越大,第j维测试数据的分类效果越好,的值越大,即的值越大,t时刻的测试数据与初始聚类中心z的测试数据越不可能是一类;当t时刻数据序列与初始聚类中心z在多个维度的测试数据上的差异越大,的值越大,t时刻数据序列的近邻集合与初始聚类中心z的近邻集合分布差异越大,的值越大,即的值越小,t时刻数据序列中得测试数据对初始聚类中心z得修正程度越弱。类内修正距离考虑了初始聚类中心划分测试数据后不同聚类簇内数据对聚类中心的影响程度,其有益效果在于通过衡量不同时刻测试数据的近邻集与聚类中心的近邻之间的分布差异提高迭代自组织聚类isodata算法中的聚类中心修正精度。至此,得到每个时刻的类内修正距离。
51.根据所述类内修正距离获取迭代自组织聚类isodata算法中的聚类中心修正过程,计算初始聚类中心,计算公式为:其中,是聚类过程中初始聚类中心z的更新结果,、分别是t时刻的数据序列、类内修正距离,是初始聚类中心z对应聚类簇中的数据量。
52.对于步骤s5,所述基于测试数据的聚类结果,对测试数据进行分区存储管理,所述分区存储管理是指将合格数据和不合格数据分区存储管理的步骤,包括:将上述所得初始聚类中心作为迭代自组织聚类isodata算法对测试数据聚类时的
初始聚类中心,基于改进后的迭代自组织聚类isodata算法对测试数据进行分类,得到多个测试数据的聚类簇。然后,将每个聚类簇的聚类中心对应的测试数据与电池(磷酸铁锂)充电测试不同阶段的标准数据进行比较,如果测试数据与标准数据所有维度差值中的最大值大于阈值y,y的大小取经验值5,则认为电池(磷酸铁锂)内部可能发生微短路或者微型电池等现象,相应的电池(磷酸铁锂)的测试结果属于不合格产品;否则认为电池(磷酸铁锂)的测试结果属于合格产品。
53.将电池(磷酸铁锂)的测试结果发送至测试数据管理系统,对于不合格产品的测试数据和合格产品的测试数据进行分类存储,并统计不合格产品的测试数据中各因素测量值的分布曲线,测试数据管理系统根据所述分布曲线向质检员发送对应的指令,对于测试结果为不合格产品的电池(磷酸铁锂)进行专业维修。
54.至此,本技术提供的一种新能源电源测试数据管理方法全部过程结束。本技术实施例主要是通过对电池测试过程中所采集到的测试数据进行预处理,得到每一时刻的数据序列,通过数据序列内不同维度数据的分布情况构建测试数据密度,测试数据密度考虑了每个时刻与相邻时刻的数据波动情况以及不同维度数据的信息熵,能够有效避免因不同的电池处在测试过程中不同阶段所产生的数据差异,而导致在区分异常测试数据和正常测试数据时,形成干扰误差,有利于提高后续测试数据聚类精度。进一步地,通过根据测试数据的聚类结果,对测试数据进行分区存储管理,将合格数据和不合格数据分区存储管理,有利于提高测试数据的检索效率和利用率,便于后续对测试数据进行分析和评估,尽可能提高电池筛选的正确率。
55.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
56.本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器1001进行加载和执行。
57.为此,本技术实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器1001进行加载,以执行本技术实施例所提供的任一种新能源电源测试数据管理方法中的步骤。例如,该计算机程序可以执行如下步骤:采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据;基于所述数据序列内多维度的测试数据的分布情况构建测试数据密度;基于所述测试数据密度得到初始聚类中心;根据每个时刻的测试数据密度、数据序列以及初始聚类中心,并通过算法修正聚类中心,得到测试数据的聚类结果;基于测试数据的聚类结果,对测试数据进行分区存储管理,所述分区存储管理是指将合格数据和不合格数据分区存储管理。
58.以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
59.其中,该存储介质可以包括:只读存储器1005(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
60.由于该存储介质中所存储的计算机程序,可以执行本技术实施例所提供的任一种
新能源电源测试数据管理方法中的步骤,因此,可以实现本技术实施例所提供的任一种新能源电源测试数据管理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
61.以上对本技术实施例所提供的一种一种新能源电源测试数据管理方法及系统进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种新能源电源测试数据管理方法,其特征在于,方法包括:采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据;基于所述数据序列内多维度的测试数据的分布情况构建测试数据密度;基于所述测试数据密度得到初始聚类中心;根据每个时刻的测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到测试数据的聚类结果;基于测试数据的聚类结果,对测试数据进行分区存储管理,所述分区存储管理是指将合格数据和不合格数据分区存储管理。2.根据权利要求1所述的一种新能源电源测试数据管理方法,其特征在于,所述采集电池测试过程中的测试数据,并对所述测试数据进行预处理,得到每一时刻所对应的数据序列,所述数据序列包括多维度的测试数据的步骤,包括:利用多种传感器分别采集电池在测试过程中的多种测试数据;通过均值填充算法对多种测试数据进行计算,得到电池在测试过程中每一时刻的数据序列;所述多维度的测试数据包括电压、温度、电量、电流四个维度的测试数据。3.根据权利要求1所述的一种新能源电源测试数据管理方法,其特征在于,所述基于所述数据序列内多维度的测试数据的分布情况构建测试数据密度的步骤,包括:根据所述数据序列内多维度的测试数据之间的影响关系,对数据序列中每个维度的测试数据按照从小至大的顺序排序;获取测试数据中每一维度所包含的数据量,得到每一维度各自的统计直方图,所述统计直方图中的横坐标表示同一种维度的测试数据的不同取值,纵坐标表示对应取值所包含的数据量;依据所述统计直方图计算出测试数据密度。4.根据权利要求3所述的一种新能源电源测试数据管理方法,其特征在于,所述依据所述统计直方图计算出测试数据密度的公式为:述统计直方图计算出测试数据密度的公式为:述统计直方图计算出测试数据密度的公式为:其中,是t时刻数据序列中第j维数据的分布比值,是t时刻数据序列中第j维数据在统计直方图中对应的数据量,是数据序列的总数量,是统计直方图对应的信息熵,是数据序列中的维度数量;是t时刻、t+1时刻的测试波动指数,、分别是t时刻、t+1时刻数据序列所对应的分布比序列,所述分布比序列是由数据序列中每个数据的分布比值组成的,其中是指t时刻数据序列中第一维度数据的分布比值,
是分布比序列、之间的dtw距离;是t时刻的测试数据密度,是t-1时刻、t时刻的测试波动指数,是所有测试波动指数中的最大值。5.根据权利要求1所述的一种新能源电源测试数据管理方法,其特征在于,所述基于所述测试数据密度得到初始聚类中心的步骤,包括:获取每个时刻所对应的测试数据密度;利用k-means聚类算法对所有时刻的测试数据密度进行聚类,聚类过程中的度量距离为两个测试数据密度的差值;计算每个聚类簇中测试数据密度的均值,将均值中最大值所在聚类簇中的测试数据密度对应时刻的数据序列作为后续测试数据聚类的初始聚类中心。6.根据权利要求1所述的一种新能源电源测试数据管理方法,其特征在于,所述根据每个时刻的测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到测试数据的聚类结果的步骤,包括:根据每个时刻的测试数据密度、数据序列以及初始聚类中心获取每个时刻数据序列的k近邻集合,并根据k近邻集合得到整个充电测试过程中每个时刻的k-dist图,所述k-dist图中的横坐标是每个时刻的数据序列与其第k个近邻的数据序列之间的度量距离,纵坐标是每个度量距离中包含数据序列的数量;依据每个时刻的k-dist图,构建类内修正距离,用于表征不同时刻数据序列对其所在聚类簇的聚类中心的修正程度;依据所述类内修正距离改进迭代自组织聚类isodata算法,得到测试数据的聚类结果。7.根据权利要求6所述的一种新能源电源测试数据管理方法,其特征在于,以t时刻为例,所述k近邻集合的计算公式为:例,所述k近邻集合的计算公式为:其中,是t时刻与第z个初始聚类中心的中心距离,、分别是t时刻、初始聚类中心z的数据序列,是数据序列、之间的dtw距离,、分别是t时刻、初始聚类中心z的测试数据密度;是t时刻与t+1时刻的异簇距离,是t+1时刻与第z个初始聚类中心的中心距离,是初始聚类中心的数量;分别计算t时刻与其余所有时刻的异簇距离,将异簇距离按照从小到大的顺序进行排序,取排序结果的前k个时刻作为t时刻的k近邻集合。8.根据权利要求7所述的一种新能源电源测试数据管理方法,其特征在于,所述依据每个时刻的k-dist图,构建类内修正距离的公式为:
其中,是t时刻与初始聚类中心z的第j维差值,是第j维数据的信息增益,g是所有采集数据的集合,、分别是t时刻与初始聚类中心z的第j维数据值;是t时刻对初始聚类中心z的类内修正距离,是数据序列中的维度数量,、分别是t时刻与初始聚类中心z的k-dist图,是、之间的巴氏距离,是调参因子。9.根据权利要求8所述的一种新能源电源测试数据管理方法,其特征在于,所述依据所述类内修正距离改进迭代自组织聚类isodata算法,得到测试数据的聚类结果的步骤,包括:根据所述类内修正距离获取迭代自组织聚类isodata算法中的聚类中心修正过程,计算初始聚类中心,计算公式为:其中,是聚类过程中初始聚类中心z的更新结果,、分别是t时刻的数据序列、类内修正距离,是初始聚类中心z对应聚类簇中的数据量。10.一种新能源电源测试数据管理系统,其特征在于,包括:传感器模块,用于采集电池测试过程中产生的测试数据;预处理模块,用于接收传感器模块发送过来的测试数据,并对测试数据进行预处理,以得到每一时刻所对应的具有多种维度的数据序列;密度构建模块,用于基于数据序列内不同维度数据的分布情况构建测试数据密度,并基于测试数据密度得到初始聚类中心;根据每个时刻的k近邻集合得到对应的k-dist图,并基于k-dist图构建类内修正距离;聚类模块:用于根据类内修正距离改进迭代自组织聚类isodata算法,并根据测试数据的聚类结果对测试数据进行分区存储管理;存储管理模块:用于对聚类模块发送过来的测试数据进行分区存储管理,即将属于同一类别的测试数据存储在同一区域,并为每个区域分配一个唯一标识符。
技术总结
本申请实施例公开了一种新能源电源测试数据管理方法及系统,涉及电源测试数据管理技术领域。该方法包括:采集电池测试过程中的测试数据,并进行预处理,得到每一时刻所对应的数据序列;基于数据序列内多维度的测试数据的分布情况构建测试数据密度;基于测试数据密度得到初始聚类中心;根据测试数据密度、数据序列以及初始聚类中心,基于聚类簇中每个时刻的类内修正距离对聚类簇的初始聚类中心进行修正,得到聚类结果;基于测试数据的聚类结果,对测试数据进行分区存储管理。本申请能够有效避免因不同的电池处在测试过程中不同阶段所产生的数据差异,而导致在区分异常测试数据和正常测试数据时,形成干扰误差,有利于提高后续测试数据聚类精度。测试数据聚类精度。测试数据聚类精度。
技术研发人员:王建廷 戴畅 张振伟
受保护的技术使用者:深圳市联明电源有限公司
技术研发日:2023.06.29
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/