用于预测生物药物制造工艺的性能的方法和系统与流程

未命名 08-03 阅读:98 评论:0


1.本公开涉及一种用于预测生物药物制造和/或生物制造工艺的性能的方法和系统。


背景技术:

2.近年来,生物药物行业寻求应用各种多变量统计分析方法和机器学习算法来加深对生物药物制造工艺、工艺开发的了解并预测与生物药物制造工艺有关的各种质量参数的值。
3.在采用这种多变量统计方法和机器学习算法时,本领域已知的主要问题包括从构成生物药物制造工艺的多个单元操作中连续获取数据以及生成足够多的样本点来训练机器学习算法以准确预测未来事件所涉及的挑战。出现这些问题的部分原因是缺乏用于同时实时测量关键工艺参数并获得关键质量属性的高分辨率分析仪器系统。虽然最近正在开发能够进行这种测量的仪器系统,但要充分发挥其潜力,需要合适的复杂数据分析方法。
4.本领域已知的用于在生物药物行业中应用多变量统计和机器学习分析的方法分析来自预定义数量的不同工艺运行的数据并且以二维或三维格式维护所分析的数据。然而,这种已知方法需要从大量工艺运行中生成数据并且通常是高度复杂的算法。开发一些复杂方法的模型被认为是

黑盒’。虽然“黑盒模型”可以是准确的,但它们的结构和操作是不可解释的,因此很难用简单的语言详细说明以获得监管批准。
5.本领域已知的用于预测生物药物制造工艺的性能的机器学习算法通常需要大量的、通常不切实际的训练样本数据集,该数据集太昂贵和/或生成时间太长。还有,传统的机器学习算法需要大量的训练样本数据集来降低过拟合的风险,即模型拟合了训练数据但未来看不见的样本被错误分类的风险。
6.本领域内还已知一系列商业软件包(比如

unscrambler’和

jmp’)用于分析生物药物制造工艺数据。然而,所述商业软件包不能最大限度地利用从生物过程中连续捕获的高分辨率数据,也不能利用关键工艺参数(cpp)和关键质量属性(cqa)的时间序列分析来监测和预测性能。进一步地,时间数据并没有直接用于数据分析,而是用于对可用数据进行分层,或者被编码为分类变量。
7.wo 2018/229802涉及一种用于预测用于在生物反应器中制造样品的工艺的结果的方法。该描述中描述的模型在矩阵中垂直堆叠来自不同批次的数据。wo 2019100040公开了一种预测模型,可以根据初始、测量的浓度和历史数据来预测未来的参数浓度。ep 3702439公开了用于确定多变量工艺图表的方法、计算机程序和工艺控制设备。发表于《生物技术期刊》第162卷,2012年,huong le等人的标题为

multivariate analysis of cell culture process bio-process data-lactate composition as process indicator[细胞培养过程生物过程数据的多变量分析——以乳酸组成为过程指标]’的文档支持向量机回归,其中偏最小二乘法要求数据水平堆叠。然而,上述每一个文档都利用了复杂的模型,并没有利用时间序列分析来监测和预测性能。
[0008]
因此,本领域中未满足和未解决的需要是一种用于预测生物药物制造工艺的性能的改进系统和方法,其易于解释并且不需要大量数据进行操作并且克服了上述至少一个问题。


技术实现要素:

[0009]
本发明涉及一种用于使用由以预定采样频率测量的多个关键质量属性和多个关键工艺参数的顺序合并值训练的时间序列分析模型来预测生物药物制造和/或生物制造工艺的性能的方法和系统,如所附权利要求中所述。
[0010]
在本发明的优选实施例中,提供了一种用于预测生物药物制造工艺的性能的方法。所述方法包括:以预定采样频率测量所述生物药物制造工艺的参数,其中,针对所述工艺的n次运行来测量所述参数;将所述n次运行的参数数据以单一连续时间序列的方式顺序地连接起来,以生成表示所述n次运行的持续时间内的参数数据的变换数据;基于与多个参数相对应地生成的多个变换数据,训练用于预测所述生物药物制造工艺的性能的时间序列分析模型;在预定时间点测量所述多个参数,并使用所述测量值来强化和改进所述训练的时间序列分析模型;以及基于所述训练的时间序列分析模型来预测所述生物药物制造工艺的未来运行的所述多个参数。
[0011]
在本发明的实施例中,所述多个参数包括多个关键工艺参数(cpp)和多个关键质量属性(cqa)。
[0012]
在本发明的实施例中,所述变换数据能够捕获在所述n次运行的持续时间内的所述参数数据的季节性方面。
[0013]
在本发明的优选实施例中,提供了一种用于预测生物药物制造工艺的性能的方法。该方法包括第一步骤:针对生物药物制造工艺的一个或多个单元操作,以预定采样频率连续地测量多个关键质量属性和多个关键工艺参数。在本发明的实施例中,所测量的关键工艺参数包括活细胞密度、渗透压、至少一种代谢物的定性分析以及至少一种代谢物的定量分析,并且所测量的关键质量属性包括滴度、聚集物分布、电荷变异体分析、疏水相互作用、亲水相互作用和自中而上质量分析。自中而上质量分析还包括聚糖分析。
[0014]
针对每个单元操作,顺序地合并每个关键工艺参数和每个关键质量属性的测量值以捕获与每个单元操作相关联的趋势。然后在预定时间点测量每个关键质量属性和每个关键工艺参数的值。进一步地,使用每个关键工艺参数和每个关键质量属性的顺序合并值以及每个关键工艺参数和每个关键质量属性在预定时间点的值,不断地训练(或强化)时间序列分析模型。时间序列分析模型可以是多变量时间序列分析模型或单变量时间序列分析模型。在本发明的实施例中,所使用的多变量时间序列分析模型是向量误差修正模型。所述训练的时间序列分析模型用于针对每个单元操作来预测每个关键质量属性和每个关键工艺参数的未来值。
[0015]
在本发明的优选实施例中,提供了一种用于预测生物药物制造工艺的性能的系统。所述系统包括可操作地耦合到计算设备的存储器装置。存储器装置具有存储在其上的多个指令,这些指令配置计算设备以针对生物药物制造工艺的至少一个单元操作,以预定采样频率连续地测量多个关键工艺参数和多个关键质量属性。计算设备进一步被配置为针对每个单元操作顺序地合并所测量的关键质量属性和关键工艺参数中的每一个的值,并且
[0023]
图1图示了根据本发明的实施例的用于预测生物药物制造工艺的性能的系统;
[0024]
图2a图示了根据本发明的实施例的由图1的系统的变量测量模块获取的数据;
[0025]
图2b图示了根据本发明的实施例的由图1的系统的数据变换模块生成的变换数据;
[0026]
图2c图示了根据本发明的实施例的变换数据的图形表示;
[0027]
图3是图示了使用本发明的优选实施例对多个关键质量属性的预测的图形表示;以及
[0028]
图4是图示了根据本发明的实施例的用于预测生物药物制造工艺的性能的方法的流程图。
具体实施方式
[0029]
图1图示了根据本发明的实施例的用于监测和预测生物反应器102中的生物药物制造工艺的性能的系统100。生物药物是指由生物反应器102中培养的细胞产生的产品。生物反应器102包括细胞培养基和被配置为生产生物药物产品的生产细胞。这种细胞或生产细胞的示例包括但不限于原核细胞(比如细菌)和真核细胞(比如中国仓鼠卵巢(cho)细胞和人类胚胎肾(hek)细胞)。生物药物产品的示例包括单克隆抗体、双特异性抗体、多特异性抗体、抗体药物偶联物、蛋白质、血液因子、溶栓剂、激素、干扰素、造血生长因子以及基于核酸的生物药物产品,比如基因治疗药物、治疗、产品等。
[0030]
系统100包括变量测量模块104,其被配置为在生物反应器102的每次运行期间测量与制造工艺有关的变量参数。在本发明的上下文中,一次运行对应于端到端的生物药物制造工艺。在整个发明中,运行可互换地称为批次,反之亦然。生物药物制造是以分批或半连续模式执行的。所有工艺都具有工艺将停止的定义端点。在停机时段之后,该工艺再次从头开始。因此,经由测量而产生的数据可以被认为是不连续的、重复的时间序列。
[0031]
在本发明的实施例中,生物药物制造工艺是细胞培养过程,并且变量参数可以包括生物反应器环境的特征和制造产品的方面,比如产量和质量。本文中,变量参数可以是两种类型:关键工艺参数(cpp)和关键质量属性(cqa)。cpp的示例包括但不限于活细胞密度、渗透压、至少一种代谢物的定性分析以及至少一种代谢物的定量分析。cqa的示例包括但不限于滴度、聚集物分布、电荷变异体分析、疏水相互作用、亲水相互作用和自中而上质量分析。
[0032]
在本发明的实施例中,变量测量模块104针对生物反应器的多个批次以预定采样频率测量每个参数。因此,在每个批次期间,变量测量模块104为每个cpp或cqa获取多个样本。例如,参考图2a,对于给定变量,在第一批次/运行期间获取第一组样本202(1),在第二批次/运行期间获取第二组样本202(2),在第三批次/运行期间获取第三组样本202(3),并且在第n批次/运行期间获取第n组多个样本202(n)。
[0033]
返回图1,系统100进一步包括数据变换模块106,其被配置为将垂直形式的参数数据(如图2a所示)变换为水平形式的参数数据(如图2b所示)。针对每个变量,数据变换模块106将第一批次至第n批次的参数数据顺序地连接起来以生成变换数据。例如,参考图2b,数据变换模块106将第一、第二、第三和第n组样本202(1)、202(2)、202(3)、

、202(n)顺序地连接起来以生成给定参数的变换数据204。变换数据204指示在n次运行的持续时间内的参
数数据,并且是保持数据中的时间分辨模式并能够对生物药物制造工艺应用时间序列分析的单一时间序列。因此,本技术的创造性步骤在于将数据展开成一行水平数据(比如变换数据204)的数据变换。
[0034]
图2c图示了根据本发明的实施例的给定参数跨多次生物反应器运行的变换数据204。变换数据204形成了时间序列,该时间序列保持数据中的时间分辨模式并且使得能够应用时间序列分析来处理和预测一个或多个变量参数的未来值。变换数据204还能够捕获给定变量的诸如季节性等方面,并且还有助于建立给定变量在一段时间内的趋势。
[0035]
返回参考图1,数据训练模块108使用多个参数的多个变换数据作为训练样本数据来训练时间序列分析模型。时间序列分析模型可以是多变量时间序列分析模型或单变量时间序列分析模型。可以用于本发明目的的单变量和多变量时间序列分析模型的示例包括

自回归、自回归移动平均’、

自回归整合移动平均(arima)’、

季节性自回归整合移动平均(sarima)’、

具有外生回归量的季节性自回归整合移动平均线(sarimax)’、

向量自回归(var)’、

向量自回归移动平均线(varma)’、

向量误差修正模型(vecm)’以及

具有外生回归量的向量自回归移动平均(varmax)’。因此,传统上用于诸如天气预报和金融等领域的既定单变量和多变量算法可以用于生物药物制造工艺中的性能预测。
[0036]
可以注意到,如果没有针对数据变换模块106描述的特定变换,则生物过程数据集202(1)、202(2)、202(3)

202(n)与完善的时间序列方法不兼容。通过将每个批次连接在一起作为单一连续时间序列来变换来自多个批次的生物过程数据,使得能够使用传统的时间序列分析方法来了解生物药物制造工艺并预测这种工艺的未来性能。
[0037]
训练的时间序列分析模型用于针对生物药物制造工艺的每个单元操作来预测cpp和cqa中的每一个的未来值。变量测量模块104进一步被配置为在时间

t’测量一个或多个变量,并将测量值提供给数据训练模块108以不断强化和改进时间序列分析模型。
[0038]
系统100进一步包括性能预测模块110,其被配置为基于训练的时间序列模型来预测一个或多个变量参数。性能预测模块110提供对生物反应器102的未来工艺性能的见解或预测。
[0039]
图3是使用系统100预测生物反应器102中重组治疗工艺中的细胞培养性能的图形表示。
[0040]
变量测量模块104从用于产生单克隆抗体的cho细胞系的生物反应器获取数据。变量测量模块104采用自动测量系统,其对来自细胞培养环境的一系列测量值以及重组蛋白的关键测量值进行表征。总共执行了4次生物反应器运行,并且数据变换模块106以图2b中所示的方式将所得数据首尾相连。
[0041]
数据训练模块108采用称为向量误差修正模型(vecm)的多变量时间序列分析来预测未来性能以展示对使用时间序列分析的给定方法的利用。单个vecm时间序列预测模型使用cpp数据(乳酸、氨、谷氨酰胺、活细胞密度、活力和渗透压)和感兴趣的单个cqa进行训练。cpp数据用于预测未来24小时测试生物反应器在每个时间点的cqa值。在达到24小时预测后,所测量的数据将用于强化模型并生成新的预测。在图3中,在测试生物反应器的事件中,标记指示每个预测值并且黑线指示cqa的实际测量值。
[0042]
预测值和实际测量值展示了新颖数据变换和后续时间序列分析的准确性。时间序列模型可以在少至4个批次上进行准确训练,从而降低成本并缩短开发时间线。关键是,最
终模型是可解释的并且可以作为方程来求解,该方程可以在审批过程期间提交给监管机构,并展示关于在制造期间的工艺改变的合理性。
[0043]
在本发明的优选实施例中,系统100可以包括计算设备和可操作地耦合到计算设备的有形非暂态存储器装置。计算设备可以是个人计算机、便携式设备,比如平板计算机、膝上型计算机、智能电话、连接的家用设备或基于任何操作系统的便携式设备。部署在计算设备上的操作系统可以是windows、osx、linux、ios、android等。存储器装置可以是适于存储数据的任何内部或外部设备或基于网络的数据存储机制。
[0044]
存储器装置已经在其上存储了多个指令以用于配置计算设备以测量和处理来自生物药物制造工艺的一个或多个单元操作的多个cpp和cqa。
[0045]
计算设备被配置为针对生物药物制造工艺的至少一个单元操作以预定采样频率连续地测量cpp和cqa。计算设备进一步被配置为针对每个单元操作顺序合并所测量的cpp和cqa中的每一个的值,并在预定时间点测量cpp和cqa中的每一个的值。顺序合并值和cpp和cqa在预定时间点的测量值用作输入以不断地训练时间序列分析模型。时间序列分析模型可以是多变量时间序列分析模型或单变量时间序列分析模型。训练的时间序列分析模型用于针对生物药物制造工艺的每个单元操作来预测每个cqa和每个cpp的未来值。根据所述实施例的系统利用cpp和cqa的预测值作为训练数据,以不断强化训练的时间序列分析模型。所述系统进一步包括图形用户界面,其可操作地耦合到计算设备并且被配置为针对每个单元操作以图形方式显示每个关键质量属性和多个关键工艺参数中的每一个的预测值。
[0046]
应当理解,在本发明的上下文中,本文描述的系统和方法可以反向工作,其中可以从cqa预测cpp。一个工艺中的一个或多个单元操作可以联系起来,使得上游参数可以用来预测下游。这种方法的优点是可以实现连续制造。
[0047]
图4是图示了用于预测生物药物制造工艺的性能的方法400的流程图。在步骤402处,以预定采样频率测量生物药物制造工艺的参数,其中,针对所述工艺的n次运行来测量所述参数。
[0048]
在步骤404处,将n次运行的参数数据以单一连续时间序列的方式顺序地连接起来,以生成表示n次运行的持续时间内的参数数据的变换数据。
[0049]
在步骤406处,基于与多个参数相对应地生成的多个变换数据,训练用于预测生物药物制造工艺的性能的时间序列分析模型。
[0050]
在步骤408处,在预定时间点测量多个参数,并且所述测量值用于强化和改进训练的时间序列分析模型。
[0051]
在步骤410处,基于训练的时间序列分析模型来预测生物药物制造工艺的未来运行的多个参数。
[0052]
尽管已经参考特定实施例描述了本发明,但是该描述不意味着以限制意义进行解释。在参考本主题的描述后,所公开的实施例的各种修改以及本主题的替代实施例对于本领域技术人员将变得显而易见。因此,可以设想在不脱离所定义的本发明的精神或范围的情况下进行这种修改。
[0053]
进一步地,本领域的普通技术人员将理解,结合本文公开的实施例描述的各种说明性方法步骤可以使用电子硬件或硬件和软件的组合来实施。为了清楚地说明硬件与硬件和软件的组合的这种可互换性,上文已经大体根据其功能描述了各种图示和步骤。这种功
能被实施为硬件还是硬件和软件的组合取决于本领域普通技术人员的设计选择。这样的技术人员可以针对每个特定应用以各种方式实施所描述的功能,但是这样的明显设计选择不应被解释为导致偏离本发明的范围。本公开所描述的方法可以使用各种方式实施。例如,本公开中描述的系统可以以硬件、固件、软件或其任意组合来实施。对于硬件实施方式,处理单元或(多个)处理器或(多个)控制器可以在一个或多个专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理器件(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、处理器、控制器、微控制器、微处理器、电子器件、被设计成执行本文描述的功能的其他电子单元、或其组合内实施。
[0054]
对于固件和/或软件实施方式,软件代码可以存储在存储器装置中并由处理器执行。存储器装置可以在处理器单元内或在处理器单元外部实施。如本文所用,术语“存储器”是指任何类型的易失性存储器或非易失性存储器。
[0055]
参考附图描述的本发明中的实施例包括计算机装置和/或在计算机装置中执行的过程。然而,本发明还扩展到计算机程序,特别是存储在被适配用于将本发明付诸实践的载体上或载体中的计算机程序。程序可以是源代码、目标代码或代码中间源和目标代码的形式,比如以部分编译的形式或适合用于实施根据本发明的方法的任何其他形式。载体可以包括比如rom等存储介质,例如记忆棒或硬盘。载体可以是可以经由电缆或光缆或通过无线电或其他方式传输的电信号或光信号。
[0056]
在说明书中,术语“包括(comprise)、包括(comprises)、包括(comprised)和包括(comprising)”或其任何变体以及术语“包含(include)、包含(includes)、包含(included)和包含(including)”或其任何变体被认为是完全可互换的,并且它们应该都被提供尽可能最广泛的解释,并且反之亦然。
[0057]
本发明不限于上文所述的实施例,而是可以在结构和细节两者上变化。

技术特征:
1.一种用于预测生物药物制造工艺的性能的方法,所述方法包括以下步骤:以预定采样频率测量所述生物药物制造工艺的参数,其中,针对所述工艺的n次运行来测量所述参数;将所述n次运行的参数数据以单一连续时间序列的方式顺序地连接起来,以生成表示所述n次运行的持续时间内的参数数据的变换数据;基于与多个参数相对应地生成的多个变换数据,训练用于预测所述生物药物制造工艺的性能的时间序列分析模型;在预定时间点测量所述多个参数,并使用所述测量值来强化和改进所述训练的时间序列分析模型;以及基于所述训练的时间序列分析模型来预测所述生物药物制造工艺的未来运行的所述多个参数。2.如权利要求1所述的方法,其中,一次运行的结束的参数数据连接到下一次运行的开始的参数数据。3.如权利要求1所述的方法,其中,所述多个参数包括多个关键工艺参数(cpp)和多个关键质量属性(cqa)。4.如权利要求1所述的方法,其中,所述时间序列分析模型是多变量时间序列分析模型。5.如权利要求4所述的方法,其中,所述多变量时间序列分析模型是向量误差修正模型。6.如权利要求1所述的方法,其中,所述时间序列分析模型是单变量时间序列分析模型。7.如任一前述权利要求所述的方法,其中,所述变换数据能够捕获在所述n次运行的持续时间内的所述参数数据的季节性方面。8.如任一前述权利要求所述的方法,其中,所述多个关键工艺参数包括活细胞密度、渗透压、至少一种代谢物的定性分析以及至少一种代谢物的定量分析。9.如任一前述权利要求所述的方法,其中,所述多个关键质量属性包括滴度、聚集物分布、电荷变异体分析、疏水相互作用、亲水相互作用和自中而上质量分析。10.如权利要求9所述的方法,其中,自中而上质量分析包括聚糖分析。11.如任一前述权利要求所述的方法,其中,所述生物药物是单克隆抗体。12.如任一前述权利要求所述的方法,其中,所述生物药物制造工艺是细胞培养过程。13.一种用于预测生物药物制造工艺的性能的系统,所述系统包括:变量测量模块,所述变量测量模块被配置为以预定采样频率测量所述生物药物制造工艺的参数,其中,针对所述工艺的n次运行来测量所述参数;数据变换模块,所述数据变换模块被配置为将所述n次运行的参数数据以单一连续时间序列的方式顺序地连接起来,以生成表示所述n次运行的持续时间内的参数数据的变换数据;数据训练模块,所述数据训练模块被配置为基于与多个参数相对应地生成的多个变换数据来训练用于预测所述生物药物制造工艺的性能的时间序列分析模型,其中,所述变量测量模块被配置为在预定时间点测量所述多个参数,并使用所述测量值来强化和改进所述
训练的时间序列分析模型;以及性能预测模块,所述性能预测模块被配置为基于所述训练的时间序列分析模型来预测所述生物药物制造工艺的未来运行的所述多个参数。14.如权利要求13所述的系统,其中,一次运行的结束的参数数据连接到下一次运行的开始的参数数据。15.如权利要求13所述的系统,其中,所述多个参数包括多个关键工艺参数(cpp)和多个关键质量属性(cqa)。16.如权利要求13所述的系统,其中,所述时间序列分析模型是多变量时间序列分析模型。17.如权利要求16所述的系统,其中,所述多变量时间序列分析模型是向量误差修正模型。18.如任一前述权利要求所述的系统,其中,所述时间序列分析模型是单变量时间序列分析模型。19.如任一前述权利要求所述的系统,其中,所述多个关键工艺参数包括活细胞密度、渗透压、至少一种代谢物的定性分析以及至少一种代谢物的定量分析。20.如任一前述权利要求所述的系统,其中,所述多个关键质量属性包括滴度、聚集物分布、电荷变异体分析、疏水相互作用、亲水相互作用和自中而上质量分析。21.如权利要求20所述的系统,其中,顶部、自中而上或自底而上质量分析还包括聚糖分析。22.如任一前述权利要求所述的系统,其中,所述生物药物是单克隆抗体。23.如任一前述权利要求所述的系统,其中,所述生物药物制造工艺是细胞培养过程。24.一种用于预测生物药物制造工艺的性能的方法,所述方法包括以下步骤:a)针对至少一个单元操作,以预定采样频率测量多个关键质量属性和多个关键工艺参数;b)针对每个单元操作,顺序地合并所述多个关键质量属性中的每一个的值;c)针对每个单元操作,顺序地合并所述多个关键工艺参数中的每一个的值;d)在预定时间点测量所述多个关键质量属性和所述多个关键工艺参数;e)通过输入步骤(b)和步骤(c)中的合并值以及步骤(d)中的测量值来训练时间序列分析模型;以及f)针对每个单元操作,通过应用所述训练的时间序列分析模型来预测所述多个关键质量属性中的每一个和所述多个关键工艺参数中的每一个的值。

技术总结
本发明涉及一种用于通过以下方式预测生物药物制造工艺的性能的方法和系统:以预定采样频率测量生物药物制造工艺的参数,其中,针对所述工艺的n次运行来测量所述参数;将n次运行的参数数据以单一连续时间序列的方式顺序地连接起来,以生成变换数据;基于与多个参数相对应地生成的多个变换数据,训练用于预测生物药物制造工艺的性能的时间序列分析模型;在预定时间点测量多个参数,并使用所述测量值来强化和改进训练的时间序列分析模型;以及基于训练的时间序列分析模型来预测生物药物制造工艺的未来运行的多个参数。工艺的未来运行的多个参数。工艺的未来运行的多个参数。


技术研发人员:C
受保护的技术使用者:国家生物加工研究与培训研究所
技术研发日:2021.10.07
技术公布日:2023/8/1
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐