预测故障的系统和方法与流程

未命名 07-13 阅读:109 评论:0


1.本发明总体上涉及用于稀疏标记数据可用性场景的数据挖掘、基于深度学习的监督式机器学习,更具体地,涉及用于在煤基甲烷气井处使用的螺杆泵的故障预测和优化,以及对石化、农业、健康和其他相关行业中的各种应用的其他故障预测。


背景技术:

2.以下对相关技术的描述旨在提供与本公开领域有关的背景信息。本节可包括与本公开的各种特征相关的本领域的某些方面。然而,应该理解的是,本节仅用于加强读者对本公开的理解,而不作为对现有技术的承认。
3.煤层气(coalbed methane或coal-bed methane,cbm)是从煤层砂中提取的天然气的一种形式,在包括印度在内的许多国家是重要能源来源。该术语是指吸附到煤的固体基质中的甲烷。因为其不含硫化氢,因此被称为“脱硫气体(sweet gas)”。这种气体的存在从其在地下煤矿开采中出现而众所周知。煤层气有别于典型的砂岩或其他常规气藏,这是因为甲烷通过称为吸附的过程储存在煤中。甲烷处于近乎液态的状态,分布在煤(称为基质)内的孔隙的内部。煤中的开放裂缝(open fracture)(称为割理(cleat))也可能包含游离气体或可能被水饱和。
4.为了提取气体,在地下100至1500米(330至4920英尺)的煤层中钻一个外包钢孔(steel-encased hole)。如图1a所示,当煤层内的压力由于自然生产或从煤层抽水而下降时,气体和采出水都通过管道到达地面。然后,气体被送到压缩机站并进入天然气管道。气体和采出水都由螺杆泵(progressive cavity pump,pcp)输送。pcp是一种正排量泵,也称为前进式螺杆泵、进步式螺杆泵、单螺杆泵或螺杆泵。pcp由定子和转子组成,而pcp系统由pcp以及所有地面设备(例如,驱动头)和地下设备(例如油管、抽油杆、标签锚/无回转工具等)组成。随着转子的转动,pcp通过泵内一系列小的、固定形状的离散的空腔输送流体。这导致容积流率与旋转速率成正比例(双向),并对泵送流体施加低水平的剪切。pcp在例如食品和饮料泵送、石油泵送、煤浆泵送、污水泥浆泵送、高粘化学品泵送、暴雨流筛选、油田定向钻井中的井下泥浆马达(它逆转了过程,将液压动力转化为机械动力)、有限能量井水泵送等各种领域都有应用。人工举升用于降低地层上的生产井底压力(producing bottomhole pressure,bhp),以获得更高的油井生产率。这可以通过例如梁式泵、螺杆泵(pcp)或井下离心泵等正排量的井下泵来实现,以降低储层中的井底压力。
5.所有cbm井的初始作业目标是通过在低流动井底压力下连续产出水来降低储层中的压力。由于以下的主要运营优势而选择pcp:
6.·
pcp的固体处理能力;
7.·
耐受高百分比游离气体的能力;
8.·
低维护成本;
9.·
低成本。
10.在人工举升系统的帮助下,通过对cbm井进行脱水来生产气体。螺杆泵(pcp)系统
被用作所有井中的人工举升。为了优化气体生产,最大限度地减少pcp操作的停机时间是非常重要的。
11.然而,pcp泵可能会出现故障。根据统计报告,cbm井的pcp泵的故障占所有井场故障的70-80%以上,并导致每口井每年大约40天的停机时间。管柱完整性问题(抽油杆和/或油管柱故障)是造成计划外作业的最主要原因,如果通过改进监测来防止这种情况发生,可以改善运行时间并降低成本。在cbm油田,pcp系统故障是油井生产寿命中停机时间的主要来源,启用早期预测将大大减少停机时间。
12.这些故障导致每单位总成本很高。因此,准确预测故障是实现持续生产和提前预测泵故障的首要目标,以优化维护人员部署和更换零件的准备,从而降低成本。cbm油田的pcp系统中的管柱完整性故障的类型属于以下类别之一:
[0013][0014]
1.油管穿孔;
[0015]
2.抽油杆松开/断裂或油管松开/断裂。
[0016]
煤基甲烷气井处使用的pcp泵容易受到磨损,继而部件或油井整体的故障会导致运营损失和业务。部件故障、多部件故障或积砂都可能导致运营损失。根据故障原因、故障类型(油管完整性、砂清理、泵故障、砂和泵、抽油杆完整性等),还需要标记和定义故障。在cbm油田,pcp系统故障是油井生产寿命中停机时间的主要来源,启用早期预测将大大减少停机时间。
[0017]
监督式机器学习模型可以用于识别和预测故障。但是,这种监督式学习模型需要对应于不同类型的故障和故障前实例(pre-failure instances)的数据。提供用于所有类型的故障和模型(从有限的数据中建立)的数据是不可行的,因此,在没有可用数据的情况下,预测故障可能是不准确的。目前,还没有对于基于可用于预测不同类型的故障和故障前实例的有限数据的无监督式学习模型的解决方案。也没有可用的解决方案来帮助提高数据质量,这是因为所提出的方法准确地对特征向量的复杂分布进行建模,并且能够更好地发现与用于检测故障的正态数据分布的偏差。此外,没有用于通过将故障前的某些天的数据标记为属于故障数据来改进先前的标记方法的解决方案,这将使得噪声数据减少并改善良好的工作条件数据。当前技术的另一个限制是,没有用于分析和分类目前部署在cbm油田中的pc泵的故障类型(可以提前预测pc泵的故障天数)的解决方案。此外,没有更好的最优方案来提高预测的准确性且其中假阳性和假阴性应该是最小的。
[0018]
因此,本领域需要一种基于有限数据优化生产的方法,其可以预测与气体提取部件相关联的不同类型的故障和故障前实例。
[0019]
本公开的目的
[0020]
本发明的一个目的是提供一种方法和系统,其可以基于能够预测不同类型的故障和故障前实例的有限数据来提供可用于监督式学习模型的解决方案。
[0021]
本发明的另一目的是提供一种解决方案,其通过将故障前的某些天的数据标记为属于故障数据来改进先前的标记方法,这将使得噪声数据减少并改善良好的工作条件数据。
[0022]
本发明的另一目的是提供一种解决方案,由于所提出的方法准确地对特征向量的复杂分布进行建模,并且更好地发现与用于检测故障的正态数据分布的偏差,所以该解决
方案有助于提高数据质量。
[0023]
本发明的一个目的是提供一种方法和系统,以智能地识别解决方案来改进解决故障数据有限或不可用的方法。
[0024]
本发明的另一目的是提供一种解决方案,其有助于分析和分类当前部署在cbm油田中的pc泵的故障类型,可以提前预测pc泵的故障天数。
[0025]
本发明的另一目的是提供一种解决方案,其有助于预测在用于气体提取的煤层气(cbm)井处使用的螺杆泵(pcp)中的故障。
[0026]
本发明的另一目的是提供一种解决方案,其有助于分析和分类任何类似设备的故障类型,可以提前预测设备的故障天数。
[0027]
本发明的另一目的是提供一种更好的最佳解决方案,以增加预测的准确度且其中假阳性和假阴性应该是最小的。
[0028]
本发明的另一目的是提供一种解决方案,其可以通过预测设备的故障来降低设备的租赁运营费用、减少气体的延期生产、减少非生产时间、缓解租用限制、改善不确定环境中的现金流并提供可持续的经济生产、最大化储量回收等。
[0029]
本发明的又一目的是提供一种提供预测分析的无缝增强机制,以为在包括但不限于支持5g/4g/3g/ev-do/ehrpd技术的无线网络上的精确和决策服务提供信息输出。
[0030]
本发明的又一目的是提供一种提供预测优化分析的无缝增强的机制,为用户设备中的精确和决策服务提供信息输出,而与ue是否支持5g/4g/3g/ev-do/ehrpd技术无关。
[0031]
本发明的另一目的是通过预测操作挑战和节省成本向勘探者提供增值服务。


技术实现要素:

[0032]
提供该部分是为了以简化形式介绍本发明的某些目的和方面,这些目的和方面将在下面的详细描述中进一步描述。本发明内容不旨在确定所要求保护的主题的关键特征或范围。
[0033]
为了实现上述目的,在一个方面,本发明提供了一种用于促进对与采矿井中的气体提取相关联的部件的磨损和后续的故障进行预测的系统和方法。该系统可包括通信地耦接到用于气体提取的采矿井的一个或多个用户设备,以及耦接到采矿井中的一个或多个泵的一个或多个传感器。该一个或多个用户设备还可以包括执行存储在存储器中的可执行指令集的一个或多个处理器,在执行该可执行指令集时,处理器可以使该系统通过数据获取引擎从一个或多个传感器获取数据包集合,其中可以在任何同步和异步时间实例处接收该数据包集合,并且通过特征生成引擎从同步的数据包中提取属性集合。特征生成引擎可以被配置为从所提取的属性集合中生成特征,所提取的属性集合与所接收的数据包的插值相关联。处理器还可以使系统通过生成自适应网络(gan)引擎基于所提取的属性集合的生成特征来评估模型参数集合,并基于对该模型参数集合的评估,通过预测引擎预测与所接收的数据包集合相关联的故障。
[0034]
在一个方面,本发明提供了一种用于促进对与采矿井中的气体提取相关联的部件的磨损和后续的故障进行预测的方法。该方法可包括以下步骤:通过数据获取引擎从一个或多个传感器获取数据包集合,其中可以在任何同步和异步时间实例处接收该数据包集合;通过特征生成引擎从所获取的数据包集合中提取属性集合,其中该特征生成引擎可被
配置为从所提取的属性集合中生成特征,所提取的属性集合与所获取的数据包的插值相关联;通过生成自适应网络(gan)引擎基于所提取的属性集合的生成特征来评估模型参数集合,并基于对该模型参数集合的评估,通过预测引擎预测与所接收的数据包集合相关联的故障。
附图说明
[0035]
在此并入并构成本发明一部分的附图示出了所公开的方法和系统的示例性实施例,其中在不同的附图中,类似的附图标记指代相同的部分。附图中的部件不一定是按比例绘制的,而是强调清楚地示出本发明的原理。一些附图可以使用框图来指示部件,并且可以不代表每个部件的内部电路。本领域技术人员将理解,这种附图的发明包括通常用于实现这种部件的电气部件、电子部件或电路的发明。
[0036]
图1a示出了根据本公开的实施例的煤层气井。
[0037]
图1b示出了根据本公开的实施例的典型pcp装置。
[0038]
图2a示出了根据本公开的实施例的在其中或利用其可以实现本公开的系统的示例性网络架构(200)。
[0039]
图2b示出了根据本公开的实施例的系统(110)或集中式服务器(112)的示例性表示(200)。
[0040]
图3a示出了根据本公开的实施例的使用不同rat锁存的用户设备的示例性表示系统架构。
[0041]
图3b示出了根据本公开的实施例的描绘系统的用户设备架构的示例性表示。
[0042]
图4示出了根据本公开的实施例的描绘用于预测故障的方法的示例性方法流程图(400)。
[0043]
图5a示出了根据本公开的实施例的通用自适应网络(general adaptive network,gan)引擎的示例性表示系统架构。
[0044]
图5b示出了根据本公开的实施例的数据标记引擎的示例性表示系统架构。
[0045]
图6a示出了根据本公开的实施例的gan训练引擎的示例性表示系统架构。
[0046]
图6b示出了根据本公开的实施例的用于检测异常的流程图的示例性表示。
[0047]
图6c示出了根据本公开的实施例的样本的散点图的示例性表示。
[0048]
图7示出了根据本公开的实施例的示例性表示过程流程图。
[0049]
图8示出了根据本公开的实施例的pcp故障预测引擎的示例性表示系统架构。
具体实施方式
[0050]
在下面的描述中,出于解释的目的,对具体细节进行阐述以便提供对本发明实施例的透彻理解。然而,显而易见的是,可以在没有这些特定细节的情况下实施各种实施例。这些附图和描述并不是限制性的。
[0051]
参考图2a,其示出了根据本公开的实施例的在其中或利用其可以实现本公开的系统106的示例性网络架构100。如图所示,示例性架构100包括配备有机器学习预测引擎218(在下文中也称为预测引擎218)的建模系统106,用于促进对与煤层气(cbm)井中的气体提取相关联的部件的磨损和后续故障的预测。建模系统106可以进一步耦接到一个或多个用
system for mobile communication,gsm)技术的继承者,目前支持各种空中接口标准,例如宽带码分多址(wideband-code division multiple access,w-cdma)、时分码分多址(time division-code division multiple access,td-cdma)和时分同步码分多址(time division-synchronous code division multiple access,td-scdma)。umts还支持增强型3g数据通信协议,例如高速分组接入(time division-synchronous code division multiple access,hspa),其向相关的umts网络提供更高的数据传输速度和容量。随着对移动数据和语音接入需求的持续增长,研究和开发继续推进这些技术,不仅满足不断增长的接入需求,而且推进和提高用户设备的用户体验。从3gpp版本8的gsm/edge、umts/hspa、cdma 2000/ev-do和td-scdma无线接口开始演进的一些技术,e-utra被设计成提供单一演进路径以提高数据速度和频谱效率,并允许提供更多功能。
[0056]
作为示例而非限制的特定方式,本公开可以使用3gpp的版本13中的新技术nb-iot。这种技术可以满足低端iot应用。随着nb-iot标准化的完成,它努力应对iot市场。nb-iot技术已经在许可频段(licensed band)实施。lte的许可频段用于开发这项技术。该技术利用180khz的最小系统带宽,即为该技术分配一个物理资源块(physical resource block,prb)。nb-iot可以被视为一种独立的无线电接入技术(radio access technology,rat)。nb-iot可以以3种模式部署:“带内”、“保护频带”和“独立”。在“带内”操作中,使用lte载波内存在的资源块。存在为lte信号的同步预留的、不用于nb-iot的特定资源块。在“保护频带”操作中,使用没有被任何运营商利用的lte载波之间的资源块。在“独立”操作中,使用gsm频率、或者使用可能未使用的lte频带。版本13包含重要的改进,如非连续接收(edrx)和省电模式(power save mode,psm)。在版本12中,psm确保电池寿命,对于需要更频繁接收数据的设备,通过edrx完成。
[0057]
参照图2a,图2b示出了根据本公开的实施例的用于促进与气体提取系统相关联的故障预测的建模系统106/用户设备102的示例性表示。在一方面中,系统(106)/用户设备102可以包括一个或多个处理器202。一个或多个处理器202可以实现为一个或多个微处理器、微型计算机、微控制器、数字信号处理器、基带数字处理器、中央处理单元、逻辑电路和/或基于操作指令处理数据的任何设备。在其他能力中,一个或多个处理器202可以被配置为获取并执行存储在系统106的存储器204中的计算机可读指令。存储器204可以被配置为将一个或多个计算机可读指令或例程存储在非暂时性计算机可读存储介质中,其可以被获取和执行以通过网络服务创建或共享数据包。存储器206可以包括任何非暂时性存储设备,包括例如诸如ram的易失性存储器或诸如eprom、闪存等的非易失性存储器。
[0058]
在实施例中,建模系统106/用户设备(102)可以包括一个或多个接口204。接口204可以包括各种接口,例如用于称为i/o设备的数据输入和输出设备、存储设备等的接口。接口204可以促进建模系统106的通信。接口204还可以为用户设备102的一个或多个部件提供通信路径。这种部件的示例包括但不限于处理引擎208和数据库210。
[0059]
处理引擎(208)可以被实现为硬件和编程(例如,可编程指令)的组合,以实现处理引擎(208)的一个或多个功能。在此描述的示例中,硬件和编程的这种组合可以以多种不同的方式实现。例如,用于处理引擎208的编程可以是存储在非暂时性机器可读存储介质上的处理器可执行指令,并且用于处理引擎208的硬件可以包括用于执行此类指令的处理资源(例如,一个或多个处理器)。在本示例中,机器可读存储介质可以存储指令,当由处理资源
执行时,这些指令实现处理引擎(208)。在这样的示例中,系统106/用户设备102可以包括存储指令的机器可读存储介质和执行指令的处理资源,或者机器可读存储介质可以是独立的,但是可由系统106/用户设备102和处理资源访问。在其他示例中,处理引擎208可以由电子电路实现。
[0060]
处理引擎208可以包括选自数据获取引擎212、特征生成引擎214、生成自适应网络(generative adaptive network,gan)引擎216、预测引擎218和其他引擎(220)中的任何一个的一个或多个引擎。在一个实施例中,数据获取引擎212可以使得能够从一个或多个传感器110获取数据包集合。可以在任何同步和异步时间实例处接收该数据包集合,然后由数据获取引擎212将其转换为同步数据包。在实施例中,特征生成引擎214能够通过特征生成引擎从同步的数据包中提取属性集合。特征生成引擎可以被配置为从所提取的属性集合中生成特征,所提取的属性集合与所接收的数据包的插值相关联。生成自适应网络(gan)引擎216可以被配置为基于所提取的属性集合的生成特征来评估模型参数集合,并基于对该模型参数集合的评估,预测引擎218可以检测与数据包相关联的异常并预测与所接收的数据包集合相关联的故障。
[0061]
在实施例中,gan引擎216可以包括机器学习技术,其中给定训练集,该技术学习以生成具有与训练集相同统计数据的新数据。例如,对数据进行训练的gan可以产生新的事件,这些事件至少在表面上看起来对人类观察者是真实的,具有许多现实的特征。虽然最初是作为监督式学习的生成模型形式提出的,但gan也被证明对半监督式学习、非监督式学习和强化式学习有用。在示例性实施例中,gan引擎可被配置为分析从传感器接收的每个数据包集合。
[0062]
在实施例中,预测引擎(218)可以包括使用高斯过程的机器学习方法。高斯过程是一个随机过程(由时间或空间索引的随机变量的集合),使得这些随机变量的每个有限集合具有多元正态分布,即它们的每个有限线性组合都是正态分布的。高斯过程的分布是所有这些(无限多)随机变量的联合分布,因此,它是具有连续域(例如时间或空间)的函数的分布。涉及高斯过程的机器学习算法使用懒惰学习和点之间相似性的度量(核函数)来从训练数据中预测看不见的点的值。预测不仅仅是对该点的估计,还具有不确定性信息——它是一维高斯分布(即该点的边缘分布)。对于多输出预测,使用多元高斯过程,其中多元高斯分布是每个点的边缘分布。预测引擎218还可以包括受生物神经系统处理数据的方式启发的信息处理范例的人工智能、认知建模和神经网络。人工智能和认知建模试图模拟生物神经网络的一些属性。在人工智能领域,人工神经网络已经成功地应用于语音识别、图像分析和自适应控制。在称为人工神经网络(artificial neural network,ann)或模拟神经网络(simulated neural network,snn)的人工神经元的情况下,神经网络(neural network,nn)是自然或人工神经元相互连接的组,其基于连接式计算方法使用数学或计算模型进行信息处理。在大多数情况下,ann是一种根据流经网络的外部或内部信息改变其结构的自适应系统。在更实际的术语中,神经网络是非线性统计数据建模或决策工具。它们可以用来建模输入和输出之间的复杂关系,或者在数据中寻找模式。此外,预测引擎218可以涉及由gan引擎216评估的模型参数的优化。优化是确定设计参数的值的集合的过程,该过程求解从感兴趣量(quantities of interest,qoi)导出的目标集的最大化或最小化函数。复杂系统的优化涉及确定设计参数集的最佳值,以满足基于qoi的特定目标集,其中设计参数是输入参
数的子集,qoi由输出参数确定。该系统可以是实验或计算模型。特别地,当参数空间很大时,优化需要系统的大量执行次数以获得容差极限中的期望解。
[0063]
图3a示出了根据本公开的实施例的使用不同无线电接入技术系统(radio access technology system,rats)锁存的用户设备的示例性表示系统架构。
[0064]
如图所示,在实施例中,图3a描绘了同时锁存到lte以及传统(umts/gsm/lte)或5g-nr运营商的ue/iot的系统架构。在实施例中,如图3a所示,用户设备102(ue)可以通信地耦接到enodeb 304和nodeb或基站(base station,bts)308。enodeb 304可以进一步耦接到lte网络306,而bts 308可以与utran和gsm网络310的任意一个或组合相关联。
[0065]
图3b示出了根据本公开的实施例的描绘系统的用户设备架构的示例性表示。
[0066]
在另一实施例中,下面的示意图描绘了图3a中的ue 102(智能手机/功能电话/任何其他通信设备)的简化框图表示。图3b示出了本公开的包括用于利用用户设备102的至少一个服务的系统300的高级架构的优选实施例。系统300可以包括用户设备102和配置在用户设备102内部用于提供根据本公开的各种功能的订户身份引擎(subscriber identity engine,sim)320。用户设备102还可以包括多个子系统[312、312a、320b、312c、304、314、306和316],其中所述子系统[312、312a、320b、312c、304、314、306和316]可以包括但不限于具有基带dsp处理器312c和多个无线接口312a的调制解调器子系统312。用户设备102还可以包括连接到天线308的蜂窝无线电102b的发射/接收射频(radio frequency,rf),用于接收和发射诸如voip和互联网/内部网服务的无线服务。此外,用户设备102可以包括应用处理器314、存储器子系统306、电源子系统316和外部i/o接口子系统304。本公开还包括:订户身份引擎320可以包括处理器320b、i/o接口320a、ram临时存储器320c、eeprom/非易失性存储器(non-volatile memory,nvm)[320d]和sim文件系统[320e]。此外,eeprom/非易失性存储器(nvm)[320d]可以由操作系统代码、其他sim应用程序的代码和自动imsi开关sim应用程序组成。sim文件系统[320e]和usim应用可以包含基本文件和位置参数,例如efloci(位置信息)、efpsloci(ps位置信息)、efepsloci(ps位置信息)和由在订户身份引擎[320]上运行的sim应用所使用的各种应用特定文件,以及自动imsi切换sim应用的多个内容和配置文件。
[0067]
图4示出了根据本公开的实施例的描绘用于预测故障的方法的示例性方法流程图(400)。
[0068]
在步骤402中,该方法包括通过数据获取引擎从一个或多个传感器获取数据包集合的步骤,其中在任何同步和异步时间实例处接收该数据包集合,以及在步骤404中,该方法可以包括通过特征生成引擎从所获取的数据包集合中提取属性集合,其中特征生成引擎被配置为从所提取的属性集合中生成特征,所提取的属性集合与所获取的数据包的插值相关联。
[0069]
此外,在步骤406中,该方法可以包括基于所提取的属性集合的生成特征,生成自适应网络(gan)引擎评估模型参数集合的步骤,以及基于对该模型参数集合的评估,该方法可以包括在步骤408中,预测引擎预测与所接收的数据包集合相关联的故障的步骤。
[0070]
图5a示出了根据本公开的实施例的通用自适应网络(gan)引擎的示例性表示系统架构。
[0071]
上述系统将传感器输入502-1、502-2和502-3作为原始数据用于数据获取504、清
除506和标记510,并将特征生成508数据馈送到并行处理的gan优化器引擎512,以提供用于优化故障预测方案的输出。该系统包括作为输入的场景、动态数据和元数据表,并生成优化的故障预测方案(仪表板、图表和csv文件)作为输出,以供利益相关者分析和做出决策。
[0072]
上述系统大致有以下步骤:
[0073]
·
从不同传感器的时间序列中提取特征;
[0074]
·
数据标记过程;
[0075]
·
gan模型的训练;
[0076]
·
运用流水线技术推理。
[0077]
下一节将详细介绍每个组成部分。
[0078]
数据获取504和清除506(重采样和插值):每个传感器以特定的时间间隔发出数据。每个传感器的数据发出的时间间隔是不同的。除了时间间隔之外,从传感器发出数据的实例可能不同步。将来自不同传感器的异步和不规则时间间隔数据插值为同步和规则时间间隔数据。设n是发出数据的传感器数量。在重采样和插值之后,在每个时刻处设置观测值集合其中,每个维度对应于来自传感器的插值或原始值并且其矢量表示为r
t

[0079]
特征生成508(导出特征):通过对来自插值步骤的特定传感器的观测值执行计算来导出较少的特征。根据这些特征提供的性能改进,通常在来自传感器的观测窗口上执行以下类型的计算。
[0080]
1.观测窗口上的平均值、中值、峰度等统计数据。统计数据的计算为每个观测窗口产生标量值。
[0081]
2.如傅立叶变换的频域变换或如小波等的时频变换。当应用于观测窗口时,这些变换的输出将产生值的向量。
[0082]
3.如主成分分析这样的降维可以应用于从步骤1和2中提取的特征,以降低特征向量的维度,从而提高计算性能或对噪声的鲁棒性。
[0083]
假设通过对在步骤1和步骤2中提到的不同特征使用变换,存在m个导出特征。导出特征值被附加到来自重采样和插值步骤的特征值上(称为导出特征向量)。这将产生具有值〖〖{x〗_i^t}〗_(i=1)^(m+n)的导出特征向量,其中每个维度对应于来自传感器的插值或原始信号值或导出特征值,并且其向量表示为x^t。
[0084]
图5b示出了根据本公开的实施例的数据标记引擎的示例性表示系统架构。
[0085]
在实施例中,对于每个气井,油井维修开始日期(ws
start
)和油井维修结束日期(ws
end
)可作为csv文件可用,其用于标记在特征提取过程中计算的每个观测值。油井维修开始日期和油井维修结束日期之间的所有观测值都标记为故障条件数据。此外,油井维修开始日期之前的观测窗口(w days)也被标记为故障,以启用提前预测故障。窗口(ws
start-w,ws
end
)外的所有其他观测值都被标记为属于良好状态数据的观测值。在标记过程之后,具有格式为{x
t
,y
t
}的数据,其中y
t
取值为良好或故障。
[0086]
图6a示出了根据本公开的实施例的gan训练引擎的示例性表示系统架构。
[0087]
如图所示,gan训练流程用粗体箭头表示。上面的粗箭头示出了训练过程流程,虚线箭头对应于测试流程。在训练完成后,生成器和鉴别器的模型参数(权重)可以存储为二进制格式。在推理过程中,这些权重可以被加载并在模型中用于预测。
[0088]
在如下图6a所示的训练过程中,gan模型用于对气井良好工作条件的可变性进行
建模。gan由对抗引擎、生成器g和鉴别器d组成。生成器g通过从潜在空间采样的均匀分布输入噪声的1d向量样本z到特征空间的映射g(z)来学习数据x上的分布pg。在这种设置下,网络架构是标准的神经网络解码器。设向量z的长度为lz。这里,将探索lz的不同值,并选择导致模型最佳性能的值。
[0089]
鉴别器d是将导出特征向量映射到单个标量值d(.)的神经网络。鉴别器输出d(.)可以解释为输入鉴别器d的给定输入是来自属于井的良好工作条件的训练数据或由生成器g生成的g(z)的特征向量的概率。通过以下具有价值函数v(g,d)的两个参与者的极小极大博弈来同时优化d和g。
[0090][0091]
对鉴别器进行训练,以最大化将良好工作条件训练示例分配为“良好”、将pg的样本分配为“故障”标签的概率。同时对生成器进行训练以通过最小化v(g)=log(1-d(g(z)))来欺骗d,这相当于最大化v(g)=d(g(z))。在对抗性训练期间,生成器在生成良好状态下的导出特征方面有所改进,而鉴别器在正确识别良好的和不好的特征方面有所进步
[0092]
使用生成器g和鉴别器d网络中的关于(w.r.t)不同参数的损失函数的梯度的反向传播来训练发生器和鉴别器网络。在训练引擎中迭代更新生成器和鉴别器的权重。在每次迭代中,更新生成器和鉴别器的权重。在更新生成器的权重时,鉴别器权重保持不变,而在更新鉴别器权重时,生成器权重保持不变。发生生成器和鉴别器权重更新的迭代次数称为历元数(number of epochs,n
epoch
)。
[0093]
鉴别器:鉴别器是用于识别给定样本是对应于正常样本还是失败样本的二元分类器。样本是多维的。变量空间的方面很难完全可视化,并且为了可视化的目的,使用了使用主成分分析(principal component analysis,pca)的近似来将维数降低到2。
[0094]
z估计量(zestimator):潜在空间的新特征:当对抗性训练完成时,生成器已经学习到从潜在空间表示z到cbm井的良好工作状态x的特征空间的映射g(z)。但是,gan不会自动提供从特征空间到潜在空间的逆映射μ(x)。由于潜在空间具有平滑过渡,因此对潜在空间中靠近的两个点进行采样会生成两个相似的导出特征。给定查询特征x,在对应于类似于查询特征向量x的特征g(z)的潜在空间中的点z。为了找到最佳z,从潜在空间分布中随机采样z1,并将其馈送到生成器,以获得生成的导出特征向量g(z1)。基于所生成的导出特征向量g(z1)定义损失函数,该损失函数提供用于更新z1的系数的梯度,从而产生在潜在空间中的更新位置z2。为了找到最相似的图像g(z
γ
),通过γ=1,2,3,

,γ反向传播步骤,在迭代过程中优化在潜在空间中z的位置。
[0095]
损失函数用于将新的导出特征映射到包括两个分量(即残差损失和鉴别损失)的潜在空间。残差损失加强生成的特征向量g(z
γ
)和查询特征向量之间的相似性。鉴别损失使生成的特征向量g(z
γ
)位于学习流形上。因此,通过反向传播,利用gan的两个分量来调整z的系数。
[0096]
残差损失:残差损失测量在特征空间中查询特征向量x和生成的特征向量g(z
γ
)之间的视觉差异并定义如下
[0097]
lr(z
γ
)=∑|x-g(z
γ
)|
[0098]
鉴别损失:
[0099]
ld(z
γ
)=∑|f(x)-f(g(z
γ
))|
[0100]
对于到潜在空间的映射,总损失被定义为两个分量的加权之和。
[0101]
ld(z
γ
)=(1-λ)lr(z
γ
)+λld(z
γ
)
[0102]
只是,z的系数通过反向传播来调整。生成器和鉴别器的训练参数保持不变。
[0103]
图6b示出了根据本公开的实施例的用于检测异常的流程图的示例性表示。
[0104]
在示例性实施例中,如图6b中所示,在新数据中的异常识别期间,新的查询特征向量被评估为属于正常或故障场景。用于映射到潜在空间的损失函数在每次更新迭代γ中评估生成的特征向量g(z
γ
)与在对抗训练期间看到的特征向量的兼容性。因此,可以从映射损失函数导出表示查询特征向量x与良好特征向量模型的拟合的异常分数:
[0105]
a(x)=(1-λ)r(x)+λd(x)。其中,残差分数r(x)和鉴别器分数d(x)由到潜在空间的映射过程的最后第γ次更新迭代处的残差损失lr(z
γ
)和鉴别器损失ld(z
γ
)来定义。对于故障特征向量,该模型产生大的异常分数a(x),而小的异常分数意味着在训练期间已经看到非常相似的特征向量。异常分数a(x)用于基于向量的故障检测。此外,残差向量用于基于残差较高的维度来识别故障原因。
[0106]
图6c示出了根据本公开的实施例的样本的散点图的示例性表示。
[0107]
图7示出了根据本公开的实施例的示例性表示过程流程图。
[0108]
如图所示,在示例性实施例中,可在下面提供预测gms系统(gms)优化器引擎与其他引擎/系统或子系统的工作步骤。
[0109]
在步骤702中,获取数据:每个传感器以特定的时间间隔发出数据。对于每个传感器,数据发出的时间间隔可能不同。在步骤704中,分析数据并清除数据以满足输入要求。数据中可能存在噪声或缺失值。基于信号值应该所在的极限发现噪声数据点。在识别噪声和缺失数据实例后,使用插值来估计缺失值。
[0110]
此外,在步骤706中,如果数据未同步为是,则在步骤708中,如果未同步则同步数据。除了时间间隔之外,从传感器发出数据的实例可能不同步。将来自不同传感器的异步和不规则时间间隔数据插值为同步和规则时间间隔数据。设n是发出数据的传感器数量。在重采样和插值之后,在每个时刻处设置观测值集合其中,每个维度对应于来自传感器的插值或原始值并且其矢量表示为r
t

[0111]
此外,在步骤710中,如果同步,则进行特征生成以创建新的特征生成,即,满足原始和导出数据标准。通过对来自插值步骤的特定传感器的观测值执行计算,可以导出较少的特征。根据这些特征提供的性能改进,通常在来自传感器的观测值的窗口上执行以下类型的计算。在步骤712中,对生成的数据应用gan模块,并且在步骤714中,应用分数的观测和聚合。此外,在步骤716中,预测故障的类型和可能性。
[0112]
在示例性实施例中,作为示例而非限制,可以通过比较度量召回率、精确度和准确度来评估不同的模型。召回率—召回率是正确检测到的故障数量与实际发生的故障总数的比率。
[0113]
表i示出了根据本公开的实施例的gan引擎训练的示例。
[0114][0115]
例如,如果存在nf故障,并且gan模式能够检测到n
dc
,则召回率=n
dc
/nf。
[0116]
精确度—精确度是正确检测到的故障数量与检测到的故障总数的比率。例如,gan模型检测到将要发生n
df
故障,而实际上只有n
dc
故障发生。在这种情况下,精确度=n
dc
/n
df

[0117]
真阳性—故障被检测为故障称为真阳性。真阴性—正常工作条件被检测为正常工作条件称为真阴性。准确度—准确度是真阳性和真阴性的总和与所做决策总数的比率。在用于预测优化的gms平台架构的过程的上述实施例中,在gan模型训练期间,研究以下参数集合以找到具有最佳性能的模型。表i中的数字可能只是指示性的,可以用实验中的数字来代替。
[0118]
图8示出了根据本公开的实施例的pcp故障预测引擎的示例性表示系统架构。
[0119]
在示例性实施例中,上述gms引擎的样本应用方案可涉及在煤层气(cbm)井处使用的用于气体提取的螺杆泵(pcp)中的故障预测。对故障信号的前瞻性预测将有助于提高整体运行效率,并有助于规划维护计划,以采取预防措施,减少停机时间和油井维修成本。由于积砂、积水和管道穿孔而造成pcp的故障。这些操作事件影响定子、转子、油管杆、内套管和外套管。以下是在pcp操作期间用于测量参数的传感器(iot ue)的子集:电流传感器804、扭矩传感器802、管道压力传感器806、环形流速传感器808、转速传感器810、气体流速传感器810和水流速传感器810。以下系统提供了gms引擎的详细流程,以分析cbm故障预测用例。
[0120]
cbm数据获取模块812:数据获取引擎从若干个传感器导入/获取数据,并将其存储在暂存数据对象中。这些数据对象可以在分布式环境中被管理和分区以用于数据处理。传感器可以以不同的时间频率级别记录数据。因为在此存储的数据还没有被处理,因此该数据也被称为原始数据。
[0121]
cbm时间序列数据处理模块814:数据处理步骤包括将原始数据处理成模型可使用形式(model-consumable form)的大部分过程。它涉及填充缺失值、减少噪声、从提高质量的角度清除数据,然后同步数据以实现时间一致性。
[0122]
cbm gan模型816:cbm gan模型可以包括以上各节中提到的所有过程。cbm gan模型可包括生成器、鉴别器、z估计器以及残差和鉴别器损失计算。
[0123]
cbm预测模块818:cbm预测模块818可以包括预测故障类型820和故障可能性832的聚合器和阈值系统。可以基于所有故障类型的概率的排序来确定故障类型。故障可能性可以是一个0到1.0之间的数字。值越高表示故障的可能性很高。
[0124]
相关技术的前述示例和与其相关的限制旨在说明性的而非排他性的。通过阅读说明书并研究附图,相关技术的其他限制对于本领域技术人员来说将变得显而易见。此外,该限制不受煤层气工业设备的限制,因为这只是说明性的示例,这可以适用于任何在重型设备中存在故障预测问题的类似行业。
[0125]
在另一个实施例中,该解决方案可用于预测故障、识别异常并监测设备和任何其他重型或轻型设备的健康状况。安装在设备或装置上的传感器应按时间顺序测量运行参数。然而,在物理世界中,以下是系统获取的数据质量。
[0126]
本公开的优点
[0127]
本公开提供了一种系统和方法,其基于能够预测不同类型的故障和故障前实例的有限数据来改进监督式学习模型。
[0128]
本公开提供了一种解决方案,其通过将故障前的某些天的数据标记为属于故障数据来改进先前的标记方法,这将使得噪声数据减少并改善良好工作条件数据。
[0129]
本公开提供了一种解决方案,用于分析和分类当前部署在cbm油田中的pc泵的故障类型,对于pc泵,可以提前预测故障天数。本公开提供了一种有助于预测在煤层气(cbm)井处使用的螺杆泵(pcp)中的故障的解决方案。
[0130]
本公开提供了一种解决方案,其有助于分析和分类任何类似设备的故障类型,对于设备,可以提前预测故障天数。
[0131]
本公开提供了更好的最佳解决方案,以增加预测的准确度且其中假阳性和假阴性应该是最小的。
[0132]
本公开提供了一种解决方案,其可以通过预测设备的故障来降低设备的租赁运营费用、减少气体的延期生产、减少非生产时间、缓解租用限制、改善不确定环境中的现金流并提供可持续的经济生产、最大化储量回收等。
[0133]
本公开提供了一种机制,其有助于预测分析的无缝增强,以在为包括但不限于支持5g/4g/3g/ev-do/ehrpd的技术的无线网络上的精确和决策服务提供信息输出。
[0134]
本公开提供了一种机制,该机制有助于预测优化分析的无缝增强,以为用户设备中的精确和决策服务提供信息输出,而与ue是否支持5g/4g/3g/ev-do/ehrpd技术无关。
[0135]
本公开通过预测操作挑战和节省成本向勘探者提供增值服务。

技术特征:
1.一种用于促进对与采矿井中的气体提取相关联的部件的磨损和后续的故障进行预测的系统,所述系统包括:一个或多个用户设备,所述一个或多个用户设备通信地耦接到用于气体提取的煤层气cbm井;一个或多个传感器,所述一个或多个传感器耦接到所述采矿井中的一个或多个泵;其中,所述一个或多个用户设备包括执行存储在存储器中的可执行指令集的一个或多个处理器,在执行所述可执行指令集时,所述处理器使所述系统:通过数据获取引擎从所述一个或多个传感器获取数据包集合,其中,在任何同步和异步时间实例处接收所述数据包集合;通过特征生成引擎从同步的数据包中提取属性集合,其中,所述特征生成引擎被配置为从提取的属性集合中生成特征,所述提取的属性集合与接收的数据包的插值相关联;通过生成自适应网络gan引擎基于所述提取的属性集合的生成特征来评估模型参数集合;基于所述模型参数集合的评估,通过预测引擎预测与所接收的数据包集合相关联的故障。2.根据权利要求1所述的系统,其中,所述采矿井包括任意石油、甲烷、煤层或其组合。3.根据权利要求1所述的系统,其中,通过将所述接收的数据包转换为同步和规则时间间隔的数据包,来使所述接收的数据包同步。4.根据权利要求1所述的系统,其中,所述gan引擎被配置为检测与所述模型参数集合相关联的异常。5.根据权利要求2所述的系统,其中,所述一个或多个用户设备包括sim,其中,所述sim包括与所述一个或多个用户设备相关联的基本文件和位置参数。6.根据权利要求1所述的系统,其中,gan训练引擎被配置为监测和更新一个或多个模型参数,使得所述系统被配置为训练自身以获得所述一个或多个模型参数,从而在多个时间间隔内预测异常并生成故障数据。7.根据权利要求1所述的系统,其中,所述gan训练引擎被配置为通过将故障前的某些天的数据标记为属于故障数据来标记所述故障。8.一种用于促进对与采矿井中的气体提取相关联的部件的磨损和后续的故障进行预测的方法,所述方法包括:通过数据获取引擎从一个或多个传感器获取数据包集合,其中,在任何同步和异步时间实例处接收所述数据包集合;通过特征生成引擎从所获取的数据包集合中提取属性集合,其中,所述特征生成引擎被配置为从提取的属性集合中生成特征,所述提取的属性集合与获取的数据包的插值相关联;通过生成自适应网络gan引擎基于所述提取的属性集合的生成特征来评估模型参数集合;基于所述模型参数集合的评估,通过预测引擎预测与所接收的数据包集合相关联的故障。9.根据权利要求8所述的方法,其中,对预测的故障进行标记和分类,以进行有效的规
划。10.根据权利要求8所述的方法,其中,识别噪声和缺失数据,并且其中使用插值来估计所述噪声和缺失数据。11.根据权利要求8所述的方法,其中,由所述gan引擎评估的模型参数对应于召回率、精确度和准确度,其中,所述召回率与正确检测到的故障数量和实际发生的故障总数相关联,其中,所述精确度与所述正确检测到的故障数量和检测到的故障总数相关联。

技术总结
一种用于预测故障和优化的系统和方法,其可基于能够预测不同类型的故障和故障前实例的有限数据来提供可用于非监督式学习模型的方案。该方案通过将故障前的某些天的数据标记为属于故障数据来改进先前的标记方法,这将使得噪声数据减少并改善良好工作条件数据。由于所提出的方法精确地对特征向量的复杂分布进行建模,并且更好地发现与用于检测故障的正态数据分布的偏差,因此本发明有助于提高数据质量。这种新的解决方案有助于分析和分类当前部署在CBM油田中的PC泵的故障类型,对于PC泵,可以提前预测故障天数。以提前预测故障天数。以提前预测故障天数。


技术研发人员:阿坎沙
受保护的技术使用者:吉欧平台有限公司
技术研发日:2021.11.25
技术公布日:2023/7/12
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐