一种传染病传播链条预测装置及其使用方法与流程
未命名
10-21
阅读:62
评论:0
1.本发明涉及大数据处理技术领域,特别涉及一种传染病传播链条预测装置及其使用方法。
背景技术:
2.传染病的爆发对人类健康和社会稳定造成严重影响,而预测传染病传播链条可以帮助我们更好地理解传染病的传播机制和趋势,从而采取及时的干预和控制措施。传染病传播网络是网络表示学习领域常见的网络种类之一,这种类型的网络由于节点数量多和交互信息稀疏的本身特征,将这种高维不完备网络建模为一个高维不完备张量,可以利用张量分解技术对网络中的信息进行表示和分析,对网络中现有的节点交互信息进行学习,从而对未被发现或者未来的节点交互进行高效精确的预测。所以用高维不完备张量来建模传染病传播网络,使用张量分解技术对传染病传播链条预测是一种有效的手段。
3.在传染病传播网络中,所有的感染者或者潜在的感染者都看作是网络中的节点,网络中的链接就是传染病的传播轨迹,随着时间的变化,网络中的链接也呈现动态的特征。对于这样的传染病传播网络,可以建模为一个三阶张量(个体
×
个体
×
时间),并且可以使用张量分解技术对网络链接进行预测。目前基于张量分解的网络表示学习方法都是通过cp分解,虽然cp分解在网络分析中已经展现出其强大的能力,但是对于网络链接预测的精度还有所不足。
4.在大数据的时代,网络数据是许多数据存储的主要数据类型。由于实际的传染病传播网络节点多、动态、异构的特性,在很多情况下,现有的网络表示学习方法无法对传染病传播网络精准的表示。因此,针对实际大规模传染病传播网络中的传染链,进行高精度的预测和学习,是网络表示学习中需要解决的一个关键技术问题。
技术实现要素:
5.针对现有技术中传染病传播链条预测准确性较低的问题,本发明提出一种传染病传播链条预测装置及其使用方法,通过将传染病传播链条数据进行张量构造,并将张量表示为多个低阶循坏累乘形式,捕获高维不完备张量的更多潜在特征,从而提高预测准确性。
6.为了实现上述目的,本发明提供以下技术方案:
7.一种传染病传播链条预测装置,包括数据接收模块、数据存储模块、张量构造模块和预测模块;其中,
8.数据接收模块,用于接收传染病传播链条历史数据;
9.数据存储模块,用于存储接收的传染病传播链条历史数据和预测的传染病传播概率;
10.张量构造模块,用于根据传染病传播链条历史数据构造传染病传播链条张量;
11.预测模块,用于根据传染病传播链条张量输出预测的传染病传播概率。
12.优选地,所述数据存储模块包括第一存储单元和第二存储单元;其中,
13.第一存储单元,用于将接收的传染病传播链条历史数据以四元组的形式进行存储,四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率;
14.第二存储单元,用于存储预测模块输出的预测的传染病传播概率。
15.优选地,所述张量构造模块构造传染病传播链条张量的具体方式为:
16.(2)将第一存储单元中传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;
17.(2)再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;
18.(3)最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈ri×j×k,r表示实数集。
19.优选地,所述预测模块包括初始化单元、迭代训练单元、计算单元;其中,
20.初始化单元,用于初始化传染病传播链条预测过程中所涉及的过程参数;
21.迭代训练单元,用于结合构造的传染病传播链条张量和过程参数,计算传染病传播链条历史数据的隐特征;
22.计算单元,用于根据传染病传播链条历史数据的隐特征,计算传染病传播概率。
23.本发明还提供一种传染病传播链条预测装置的使用方法,具体包括以下步骤:
24.s1:从服务器接收传染病传播链条历史数据并进行存储;
25.s2:根据传染病传播链条历史数据构造传染病传播链条张量;
26.s3:根据传染病传播链条历史数据构造目标损失函数并进行训练迭代,计算隐特征;
27.s4:根据计算的隐特征输出传染病传播概率预测值。
28.优选地,所述s1中,
29.接收的传染病传播链条历史数据以四元组的形式进行存储,四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者,p和q源自于同一个集合;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率。
30.优选地,所述s2包括以下步骤:
31.s2-1:将传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;
32.s2-2:再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;
33.s2-3:最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈ri×j×k,r表示实数集。
34.优选地,所述s3包括以下步骤:
35.s3-1:初始化传染病传播链条预测过程中所涉及的过程参数;
36.过程参数包括传染病传播链条张量a,隐特征张量p、q、t,隐特征维数r,最大训练迭代轮数max_round,训练过程中迭代轮数控制变量round,收敛终止阈值τ,正则化系数λ
p
、λq、λ
t
;
37.s3-2:根据传染病传播链条张量和过程参数,计算传染病传播链条历史数据的隐特征。
38.优选地,所述s3-2包括以下步骤:
39.s3-2-1:构造目标损失函数ε,用以下公式表示:
[0040][0041]
公式(1)中,p、q、t表示传染病传播链条历史数据的的隐特征张量;ν
ijk
∈γ在张量a中包含的已知元素;ν
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶时间隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值;λ
p
、λq、λ
t
表示正则化系数;
[0042]
s3-2-2:使用乘法更新规则对目标损失函数ε进行迭代优化,以使目标损失函数ε的值最小,训练迭代的公式如下所示:
[0043][0044]
[0045][0046]
公式(2)中,表示根据隐特征张量计算的传染病传播链条数据预测值;
[0047]
s3-2-3:判断目标损失函数ε在已知数据集合γ上是否收敛,收敛的判定条件为:
[0048]
训练迭代轮数控制变量round达到训练最大迭代轮数max_round,或者本轮迭代结束后计算得到的目标损失函数ε的值与上一轮目标损失函数ε的值之间的差的绝对值已经小于收敛终止阈值τ。
[0049]
优选地,所述传染病传播概率的计算公式为:
[0050][0051]
公式(3)中,表示传染病传播概率;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值。
[0052]
综上所述,由于采用了上述技术方案,与现有技术相比,本发明至少具有以下有益效果:
[0053]
本发明通过将传染病传播链条数据进行张量构造,并将张量拆分成多个隐特征,捕获高维不完备张量的更多潜在特征,从而提高预测准确性。
附图说明:
[0054]
图1为根据本发明示例性实施例的一种传染病传播链条预测装置示意图。
[0055]
图2为根据本发明示例性实施例的一种传染病传播链条预测装置的使用方法示意图。
具体实施方式
[0056]
下面结合实施例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
[0057]
在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所
示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0058]
如图1所示,本发明提供一种传染病传播链条预测装置,包括数据接收模块、数据存储模块、张量构造模块和预测模块。
[0059]
本实施例中,数据接收模块的输出端与数据存储模块的第一输入端连接,数据存储模块的输出端与张量构造模块的输入端连接,张量构造模块的输出端与预测模块的输入端连接,预测模块的输出端与数据存储模块的第二输入端连接。
[0060]
本实施例中,数据接收模块,用于接收传染病传播链条历史数据;
[0061]
数据存储模块,用于存储接收的传染病传播链条历史数据和预测的传染病传播链条数据。
[0062]
张量构造模块,用于根据传染病传播链条历史数据构造传染病传播链条张量;
[0063]
预测模块,用于根据传染病传播链条张量输出预测的传染病传播链条数据。
[0064]
本实施例中,数据存储模块包括第一存储单元和第二存储单元,其中,
[0065]
第一存储单元,用于将接收的传染病传播链条历史数据以四元组的形式进行存储。四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者,p和q源自于同一个集合;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率。
[0066]
第二存储单元,用于存储预测模块输出的预测的传染病传播链条数据,预测的传染病传播链条数据也以四元组的形式进行存储。
[0067]
本实施例中,张量构造模块构造传染病传播链条张量的具体方式为:
[0068]
(3)将第一存储单元中传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),运用m
(1)
的数据(p,q,t)构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;
[0069]
(2)再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;
[0070]
(3)最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈ri×j×k(r表示实数集),由于每个个体在某一个时间段只能与其他小部分个体之间有传染病传播概率,并且传染病传播概率都是0-1之间的正值,0表示无接触即0传播风险,1表示已经传染,数值越大传播概率越高,因此构造的传染病传播链条张量a是一个非负稀疏张量,用已知数据集合γ表示传染病传播链条张量a中已知的元素和其索引坐标组成的集合。
[0071]
本实施例中,预测模块包括初始化单元、迭代训练单元、计算单元。
[0072]
本实施例中,初始化单元,用于初始化传染病传播链条预测过程中所涉及的过程参数;过程参数包括传染病传播链条张量a,隐特征张量p、q、t,隐特征维数r,最大训练迭代轮数max_round,训练过程中迭代轮数控制变量round,收敛终止阈值τ,正则化系数λ
p
、λq、λ
t
。其中,
[0073]
隐特征维数r1、r2、r3决定了隐特征张量p∈r
r3
×i×
r1
、q∈r
r1
×j×
r2
、t∈r
r2
×k×
r3
的隐特征空间维数,r1、r2、r3一般都初始化为正整数20;
[0074]
三阶隐特征张量p、q、t用来存储隐特征参数,它们的大小由对应的传染病传播链条张量a的每个维度值和隐特征维数r1、r2、r3确定,即p为i个r3*r1大小的矩阵构成的隐特征张量、q为j个r1*r2大小的矩阵构成的隐特征张量、t为k个r2*r3大小的矩阵构成的隐特征张量,对于三个隐特征张量分别用0-0.25之间的随机小数(可根据具体案例调整)进行初始化;
[0075]
最大训练迭代轮数max_round是控制迭代过程上限的变量,初始化为较大的正整数,例如400;
[0076]
迭代轮数控制变量round初始化为0;
[0077]
收敛终止阈值τ是判断迭代过程是否已收敛的参数,用极小的正数初始化,例如0.0001;
[0078]
正则化系数λ
p
、λq、λ
t
是控制提取迭代过程中,对应隐特征张量p、q、t相关元素的正则化效应的常数,初始化为较小的正数(例如0.01)。
[0079]
本实施例中,迭代训练单元,用于结合构造的传染病传播链条张量和过程参数,训练传染病传播链条历史数据的计算隐特征,具体为:
[0080]
根据构造的传染病传播链条张量a和过程参数,训练获取传染病传播链条历史数据的隐特征张量p、q、t的值,采用0-0.25之间的随机小数(可根据具体案例调整)进行初始化。
[0081]
对传染病传播链条张量a的已知数据集合γ,构造目标损失函数ε,用以下公式表示:
[0082][0083]
公式(1)中,p、q、t表示传染病传播链条历史数据的三阶隐特征张量;v
ijk
∈γ在张量a中包含的已知元素;v
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值;λ
p
、λq、λ
t
表示正则化系数;
[0084]
并以欧式距离作为优化目标;使用吉洪诺夫正则化,对优化过程进行约束,防止优化过程中出现过拟合的问题;
[0085]
然后,为保证更新过程中的非负性使用乘法更新规则对目标损失函数ε进行迭代优化,以使目标损失函数ε的值最小,训练迭代的公式如下所示:
[0086][0087]
公式(2)中,表示根据隐特征张量计算的传染病传播链条数据预测值。
[0088]
在已知数据集合γ上重复上述训练过程,直至目标损失函数ε在已知数据集合γ上收敛,收敛判定条件为训练迭代轮数控制变量round达到训练最大迭代轮数max_round,或者本轮迭代结束后计算得到的目标损失函数ε的值与上一轮目标损失函数ε的值之间的差的绝对值已经小于收敛终止阈值τ。
[0089]
本实施例中,计算单元,用于根据训练单元得到的历史传染病传播链条数据的隐特征,计算传染病传播链条预测值。
[0090]
当目标损失函数ε在已知数据集合γ上对收敛后,利用目标损失函数ε达到最小值时训练得到的隐特征张量p、q、t,计算精度最高的第i个个体在第k个时间与个体j之间传染病传播概率计算公式为:
[0091][0092]
公式(3)中,ν
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值。
[0093]
本装置可部署于一个现有的服务器中,也可部署于一个单独设置的、专用于进行传染病传播链条预测的服务器中。
[0094]
基于上述装置,如图2所示,本发明还提供一种传染病传播链条预测装置的使用方法,具体包括以下步骤:
[0095]
s1:服务器下发传染病传播链条预测指令到装置,装置从服务器接收传染病传播链条历史数据并进行存储。
[0096]
本实施例中,接收的传染病传播链条历史数据以四元组的形式进行存储。四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者,p和q源自于同一个集合;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率。
[0097]
s2:根据传染病传播链条历史数据构造传染病传播链条张量。
[0098]
s2-1:将传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),运用m
(1)
的数据(p,q,t)构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;
[0099]
s2-2:再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;
[0100]
s2-3:最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈ri×j×k(r表示实数集),由于每个个体在某一个时间段只能与其他小部分个体之间有传染病传播概率,并且传染病传播概率都是0-1之间的正值,0表示无接触即0传播风险,1表示已经传染,数值越大传播概率越高,因此构造的传染病传播链条张量a是一个非负稀疏张量,用已知数据集合γ表示传染病传播链条张量a中已知的元素和其索引坐标组成的集合。
[0101]
s3:根据传染病传播链条历史数据构造目标损失函数ε并进行训练迭代,计算隐特征。
[0102]
s3-1:初始化传染病传播链条预测过程中所涉及的过程参数。
[0103]
过程参数包括传染病传播链条张量a,隐特征张量p、q、t,隐特征维数r,最大训练迭代轮数max_round,训练过程中迭代轮数控制变量round,收敛终止阈值τ,正则化系数λ
p
、λq、λ
t
。其中,
[0104]
隐特征维数r1、r2、r3决定了隐特征张量p∈r
r3
×i×
r1
、q∈r
r1
×j×
r2
、t∈r
r2
×k×
r3
的隐特征空间维数,一般都初始化为正整数20;
[0105]
三阶隐特征张量p、q、t用来存储隐特征参数,它们的大小由对应的传染病传播链条张量a的每个维度值和隐特征维数r1、r2、r3确定,即p为i个r3*r1大小的矩阵构成的隐特征张量、q为j个r1*r2大小的矩阵构成的隐特征张量、t为k个r2*r3大小的矩阵构成的隐特征张量,对于三个隐特征张量分别用0-0.25之间的随机小数(可根据具体案例调整)进行初始化;
[0106]
最大训练迭代轮数max_round是控制迭代过程上限的变量,初始化为较大的正整数,例如400;
[0107]
迭代轮数控制变量round初始化为0;
[0108]
收敛终止阈值τ是判断迭代过程是否已收敛的参数,用极小的正数初始化,例如0.0001;
[0109]
正则化系数λ
p
、λq、λ
t
是控制提取迭代过程中,对应隐特征张量p、q、t相关元素的正则化效应的常数,初始化为较小的正数(例如0.01)。
[0110]
s3-2:根据传染病传播链条张量和过程参数,计算传染病传播链条历史数据的隐特征。
[0111]
s3-2-1:构造目标损失函数ε,用以下公式表示:
[0112][0113]
公式(4)中,p、q、t表示传染病传播链条历史数据的三阶隐特征张量;v
ijk
∈γ在张量a中包含的已知元素;v
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值;λ
p
、λq、λ
t
表示正则化系数;
[0114]
s3-2-2:使用乘法更新规则对目标损失函数ε进行迭代优化,以使目标损失函数ε的值最小,训练迭代的公式如下所示:
[0115][0116]
公式(5)中,表示根据隐特征张量计算的传染病传播链条数据估计值;
[0117]
s3-2-3:判断目标损失函数ε在已知数据集合γ上是否收敛。
[0118]
在已知数据集合γ上重复上述训练过程,直至目标损失函数ε在已知数据集合γ上收敛,收敛判定条件为:
[0119]
训练迭代轮数控制变量round达到训练最大迭代轮数max_round,或者本轮迭代结束后计算得到的目标损失函数ε的值与上一轮目标损失函数ε的值之间的差的绝对值已经小于收敛终止阈值τ。
[0120]
s4:根据计算的隐特征输出传染病传播概率预测值。
[0121][0122]
公式(6)中,ν
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值。
[0123]
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
技术特征:
1.一种传染病传播链条预测装置,其特征在于,包括数据接收模块、数据存储模块、张量构造模块和预测模块;其中,数据接收模块,用于接收传染病传播链条历史数据;数据存储模块,用于存储接收的传染病传播链条历史数据和预测的传染病传播概率;张量构造模块,用于根据传染病传播链条历史数据构造传染病传播链条张量;预测模块,用于根据传染病传播链条张量输出预测的传染病传播概率。2.如权利要求1所述的一种传染病传播链条预测装置,其特征在于,所述数据存储模块包括第一存储单元和第二存储单元;其中,第一存储单元,用于将接收的传染病传播链条历史数据以四元组的形式进行存储,四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率;第二存储单元,用于存储预测模块输出的预测的传染病传播概率。3.如权利要求1所述的一种传染病传播链条预测装置,其特征在于,所述张量构造模块构造传染病传播链条张量的具体方式为:(1)将第一存储单元中传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;(2)再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;(3)最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈r
i
×
j
×
k
,r表示实数集。4.如权利要求1所述的一种传染病传播链条预测装置,其特征在于,所述预测模块包括初始化单元、迭代训练单元、计算单元;其中,初始化单元,用于初始化传染病传播链条预测过程中所涉及的过程参数;迭代训练单元,用于结合构造的传染病传播链条张量和过程参数,计算传染病传播链条历史数据的隐特征;计算单元,用于根据传染病传播链条历史数据的隐特征,计算传染病传播概率。5.基于权利要求1-4任一项所述一种传染病传播链条预测装置的使用方法,其特征在于,具体包括以下步骤:s1:从服务器接收传染病传播链条历史数据并进行存储;s2:根据传染病传播链条历史数据构造传染病传播链条张量;s3:根据传染病传播链条历史数据构造目标损失函数并进行训练迭代,计算隐特征;s4:根据计算的隐特征输出传染病传播概率预测值。6.如权利要求5所述的一种传染病传播链条预测装置的使用方法,其特征在于,所述s1中,接收的传染病传播链条历史数据以四元组的形式进行存储,四元组表现形式为m=(p,q,t,v);其中,m表示传染病传播链条历史数据;p和q分别表示感染者或者潜在的感染者,p
和q源自于同一个集合;t表示个体p和个体q的接触时间段,v表示个体p在时间段t与个体q之间的传染病传播概率。7.如权利要求5所述的一种传染病传播链条预测装置的使用方法,其特征在于,所述s2包括以下步骤:s2-1:将传染病传播链条历史数据按照接触时间段划分为k个时间段,从中选择出t=1的四元组m
(1)
=(p,q,t,v),构造切片矩阵t
(1)
,t
(1)
的大小为i行、j列,矩阵中的元素t
(1)ij
表示在第1个时间段个体i在时间段t与个体j之间的传染病传播概率,其中i表示感染者的数量集合,j表示潜在感染者的数量集合,1≤i≤i,1≤j≤j;s2-2:再从四元组m=(p,q,t,v)中依次选择出其他时间段对应的四元组m
(2)
、m
(3)
、
…
、m
(k)
分别构造切片矩阵t
(2)
、t
(3)
、
…
、t
(k)
;s2-3:最后将k个切片矩阵在三维空间中根据划分的时间段由小到大依次从前到后排列构造传染病传播链条张量a∈r
i
×
j
×
k
,r表示实数集。8.如权利要求5所述的一种传染病传播链条预测装置的使用方法,其特征在于,所述s3包括以下步骤:s3-1:初始化传染病传播链条预测过程中所涉及的过程参数;过程参数包括传染病传播链条张量a,隐特征张量p、q、t,隐特征维数r,最大训练迭代轮数max_round,训练过程中迭代轮数控制变量round,收敛终止阈值τ,正则化系数λ
p
、λ
q
、λ
t
;s3-2:根据传染病传播链条张量和过程参数,计算传染病传播链条历史数据的隐特征。9.如权利要求8所述的一种传染病传播链条预测装置的使用方法,其特征在于,所述s3-2包括以下步骤:s3-2-1:构造目标损失函数ε,用以下公式表示:1:构造目标损失函数ε,用以下公式表示:公式(1)中,p、q、t表示传染病传播链条历史数据的的隐特征张量;v
ijk
∈γ在张量a中包含的已知元素;v
ijk
表示传染病传播链条张量a中已知实体,即第i个个体在第k个时间与个体j之间传染病传播概率;表示三阶隐特征张量p中处于(r3,i,r1)位置的值;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶时间隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值;λ
p
、λ
q
、λ
t
表示正则化系数;s3-2-2:使用乘法更新规则对目标损失函数ε进行迭代优化,以使目标损失函数ε的值最小,训练迭代的公式如下所示:
公式(2)中,表示根据隐特征张量计算的传染病传播链条数据预测值;s3-2-3:判断目标损失函数ε在已知数据集合γ上是否收敛,收敛的判定条件为:训练迭代轮数控制变量round达到训练最大迭代轮数max_round,或者本轮迭代结束后计算得到的目标损失函数ε的值与上一轮目标损失函数ε的值之间的差的绝对值已经小于收敛终止阈值τ。10.如权利要求5所述的一种传染病传播链条预测装置的使用方法,其特征在于,所述传染病传播概率的计算公式为:公式(3)中,表示传染病传播概率;表示三阶隐特征张量q中处于(r1,j,r2)位置的值;表示三阶隐特征张量t中处于(r2,k,r3)位置的值;r3、i、r1表示三阶隐特征张量p三个维度的大小;r1、j、r2表示三阶隐特征张量q三个维度的大小;r2、k、r3表示三阶隐特征张量t三个维度的大小;r1、r2、r3是r1、r2、r3的索引值;μ表示已知传染病传播概率的均值。
技术总结
本发明公开一种传染病传播链条预测装置及其使用方法,包括数据接收模块、数据存储模块、张量构造模块和预测模块;其中,数据接收模块,用于接收传染病传播链条历史数据;数据存储模块,用于存储接收的传染病传播链条历史数据和预测的传染病传播概率;张量构造模块,用于根据传染病传播链条历史数据构造传染病传播链条张量;预测模块,用于根据传染病传播链条张量输出预测的传染病传播概率。本发明通过将传染病传播链条数据进行张量构造,并将张量拆分成多个隐特征,捕获高维不完备张量的更多潜在特征,从而提高预测准确性。从而提高预测准确性。从而提高预测准确性。
技术研发人员:王渠 李学锋 罗辛 吴昊
受保护的技术使用者:重庆市大渡口区疾病预防控制中心
技术研发日:2023.07.27
技术公布日:2023/10/15
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/