基于先验循环神经网络的高速公路沥青路面使用性能预测方法
未命名
09-29
阅读:94
评论:0
1.本发明属于智能交通、智慧高速研究领域,具体涉及基于先验循环神经网络的高速公路沥青路面使用性能预测方法。
背景技术:
2.基于多源异构的高速公路路面养护数据进行数据挖掘和智慧决策是智能交通系统中的一项关键技术,对道路养护的数字化、智能化发展具有重要意义。传统高速公路路面养护方案存在劳动强度大、决策效率低,无法及时、科学地进行养护决策等问题,而高效科学的路面养护决策可以延长高速公路路面使用寿命。
3.在高速公路路面使用性能预测研究中,特征编码、自编码器等技术为高速公路路面养护数据中的字符型数据的挖掘分析提供了技术支持;信息融合、数据挖掘和深度学习等人工智能技术的发展为高速公路养护智慧决策提供了新的解决方案和途径。因此,本发明提出了基于先验循环神经网络的高速公路沥青路面使用性能预测方法。
技术实现要素:
4.发明目的:为了克服现有技术中存在的不足,提供基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其建立高速公路养护信息矩阵,并利用先验循环神经网络对高速公路沥青路面使用性能进行有效预测,可对高速公路养护决策提供技术支撑。
5.技术方案:为实现上述目的,本发明提供基于先验循环神经网络的高速公路沥青路面使用性能预测方法,包括如下步骤:
6.s1:构建高速公路路面养护信息矩阵。
7.s2:对高速公路沥青路面使用性能衰变特点与影响因素进行分析并选取相关特征。
8.s3:构建用于高速公路沥青路面使用性能预测的经典循环神经网络模型rnn-eappp。
9.s4:构建用于高速公路沥青路面使用性能预测的长短时神经网络模型lstm-eappp。
10.s5:构建用于高速公路沥青路面使用性能预测的门控循环单元神经网络模型gru-eappp。
11.s6:构建用于高速公路沥青路面使用性能预测的先验经典循环神经网络模型pk-rnn-eappp。
12.s7:构建用于高速公路沥青路面使用性能预测的先验长短时神经网络模型pk-lstm-eappp。
13.s8:构建用于高速公路沥青路面使用性能预测的先验门控循环单元神经网络模型pk-gru-eappp。
14.s9:进行对比实验,选取用于高速公路沥青路面使用性能预测的性能最好的模型pk-gru-eappp。
15.进一步的,所述步骤s1中构建高速公路路面养护信息矩阵的具体方法如下:
16.s1-1:收集高速公路路面养护数据,包括对高速公路基础特征信息描述的技术等级、路面结构、管养单位、起终点桩号、车道、建成年份、交通量和气象数据等;对高速公路路面使用性能描述的路面破损指数(pci)、路面行驶质量指数(rqi)、路面车辙指数(rdi)、路面抗滑性能指数(sri)、路面磨耗指数(pwi)、路面跳车指数(pbi)、结构强度指数(pssi)等;对高速公路历史养护情况描述的病害起止桩号、病害名称、病害长度等。
17.s1-2:对不同来源、不同格式的高速公路路面养护数据进行抽取、转换、加载,构建信息矩阵。
18.s1-3:对高速公路路面养护数据进行预处理。
19.s1-4:各模型训练前,随机抽取图像数据划分训练集和测试集。
20.进一步的,所述步骤s1-2中构建信息矩阵的具体步骤如下:
21.①
确定索引数据,构建信息表。本发明选用1千米作为路段单元长度,即单位样本的高速公路路段长度。数据表的索引数据设置为“起点桩号-终点桩号-上下行-车道”。同时,为了便于索引,将起终点桩号的“k...+...”转换为整型数值,例如“k80+300”转换为“80300”。
22.②
手动输入数据。针对数据量小、来源简单的高速公路路面养护数据,通过手动输入的方式将高速公路路面养护数据从不同的来源收集到一个数据表中,如气候数据、建成时间、路龄、路面结构等,此类数据通常无需更新或更新频率低。
23.③
批量加载。对来大批量高速公路路面养护数据,将数据从不同来源中抽取出来并经过一系列转换和整合加载到数据库中,其中来源包括定期检测报告、施工图设计表、病害明细表、交通量调查表等。对于结构化数据,可以通过数据读取和数据格式转换,并根据其与索引数据的对应关系进行匹配,加载到数据表中。对于非结构化数据,采用字符分割的方法明确每一部分的含义,例如,对于施工图设计表,其路段的位置信息形式如“下行k47+000-k50+000”,可以将字符串依据“k”、“+”及
“‑”
分割为五个部分,表征上下行、起终点位置信息,从而找到对应的索引数据。同时,对于不同病害类型与养护方案的表述,例如“横裂”、“横缝”和“横向裂缝”,采用字符分割和模糊匹配的方式将其转换成统一的表述,例如将“横、纵缝”转化为[
‘
横裂’,
‘
纵裂’],并通过与索引数据进行匹配,从而加载到数据表中。
[0024]
④
构建信息矩阵。对于每个路段单元每一年的数据作为特征向量,路段单元数据基于空间坐标进行堆叠,形成二维信息矩阵。之后考虑时间维度,根据高速公路的时间顺序构建基于时序的三维信息矩阵。
[0025]
进一步的,所述步骤s1-3中高速公路路面养护数据预处理具体方法为:
[0026]
①
独热编码。对于状态较少的特征使用独热编码,例如上下行、车道特征,“上行、一车道”转换为[1,0,1,0,0]。
[0027]
②
标签编码。首先通过对陕西高速公路路面结构、病害类型数据的分词、组合、去重,生成以下词汇表:{'ac':0,'中':5,'二灰':6,'细':19,'atb':1,'粗':17,'sma':3,'微表处脱落':11,'水泥':14,'路面抗滑性能不足':22,'裂缝':21,'坑槽':9,'sbs':2,'纵裂':18,'车辙':23,'横裂':13,'修补':7,'拥包':12,'唧浆':8,'密集横缝':10,'沉陷':
15,'网裂':20,'烧毁':16,'下沉':4},再根据词汇表将文本数据映射为数值型数据。若高速公路不同路段的病害类型数量不同导致转换后无法得到相同长度的特征向量,则进行padding操作再后面补0,使得数据可以对齐,转换后的数据形势如:[1,19,3,17,6,13,18,23,0,0,0,0]。
[0028]
③
缺失值处理。高速公路路面养护数据中,路面使用性能数据、交通量数据、气候数据等都是时间序列数据上的连续变量,如有缺失,可采用插值法来填补缺失值;对于养护措施等类别型数据,可将缺失值视为一个新的类别;对于其他空值,可采用占位符进行填充。
[0029]
④
异常值检测。本发明使用四分位距(iqr)检测法进行高速公路路面养护数据异常值处理。首先计算数据的第三四分位数q3、第一四分位数q1和中位数;其次计算箱子高度iqr=q
3-q1;再次确定异常值范围,上限为q3+1.5
×
iqr,下限为q1-1.5
×
iqr;最后将超出该范围的数据点看作异常值进行剔除。
[0030]
⑤
数据归一化。为避免模型对不同量级的特征赋予不同权重,相对削弱数值较小特征的作用,因此采用最大最小标准化进行缩放:
[0031][0032]
⑥
数据标准化。为将数据分布调整为标准正态分布便于后续机器学习模型的使用,采用z-score方法进行数据标准化,其中,μ为所有样本均值,σ为所有样本标准差:
[0033][0034]
进一步的,所述步骤s2中对高速公路沥青路面使用性能衰变特点与影响因素进行分析并选取相关特征的具体方法为:
[0035]
s2-1:新建或新大修的高速公路,在荷载、环境等因素作用下的路面衰变比较稳定,因此高速公路沥青路面使用性能借鉴标准衰变方程:
[0036]
ppi=ppi0{1-exp[-(a/t)b]}
[0037]
其中通过a、b的不同取值拟合凹形、凸性、反s形及先快速衰变后稳定型四种典型的高速公路路面使用性能变化曲线。
[0038]
s2-2:选取预测模型特征如下:混合当量、客货比、路龄、上下行、车道特征、年平均降水、年平均温度、最高温、最低温、路面结构、养护方案、pci历史数据、pqi、sri、rqi、rdi。
[0039]
s2-3:将高速公路养护数据输入决策树中,基于当年数据预测次年高速公路路面pci,并根据决策树对特征重要度评分函数,计算个特征对未来高速公路路面使用性能影响,对各特征进行重要度排序。
[0040]
进一步的,所述步骤s3中构建用于高速公路沥青路面使用性能预测的经典循环神经网络模型rnn-eappp的具体方法为:
[0041]
s3-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数。
[0042]
s3-2:设置rnn-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态。隐状态具体传递方式为:
[0043]ht
=f(wix
t
+whh
t-1
+b)
[0044]
其中,f为激活函数,一般选用tanh,wi为输入节点与隐状态之间的权重矩阵,wh为隐状态之间的权重矩阵。
[0045]
s3-3:rnn-eappp在最后一个时间步向上输出,输出方式为:
[0046]yt
=g(w
oht
)
[0047]
s3-4:rnn-eappp向上输出后连接三个维数分别为64、64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0048]
进一步的,所属步骤s4中构建用于高速公路沥青路面使用性能预测的长短时神经网络模型lstm-eappp的具体方法为:
[0049]
s4-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数。
[0050]
s4-2:设置lstm-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态。
[0051]
s4-3:lstm-eappp在最后一个时间步向上输出,并连接三个维数为64、64、1的全连接层,输出次年pci预测结果pci
t+1
。
[0052]
进一步的,所述步骤s4-2中每个循环单元传递隐状态的计算方式为:
[0053]
①
在循环单元中设置遗忘门f查看h
t-1
和x
t
来输出一个[0,1]之间的向量,用于表示细胞状态c
t-1
中的信息的保留和丢弃,计算方式下,其中为sigmoid激活函数:
[0054]ft
=σ(wf·
[h
t-1
,x
t
]+bf)
[0055]
②
在循环单元中设置输入门i用于控制信息更新,h
t-1
和x
t
进入输入门后将得到决定要更新的信息i
t
,以及当前循环单元的状态计算方式如式下,其中tanh为激活函数:
[0056]it
=σ(wi·
[h
t-1
,x
t
]+bi)
[0057][0058]
③
更新核状态c
t
,计算方式如下:
[0059][0060]
④
根据h
t-1
和x
t
得到循环单元当前时刻的输出,更新规则如下:
[0061]ot
=σ(wo[h
t-1
,x
t
]+bo)
[0062]
⑤
根据当前核状态c
t
更新当前隐状态h
t
,计算方式如下:
[0063]ht
=o
t
·
tanh(c
t
)
[0064]
进一步的,所述步骤s5中构建用于高速公路沥青路面使用性能预测的门控循环神经网络模型gru-eappp的具体方法为:
[0065]
s5-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数。
[0066]
s5-2:设置gru-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态。在lstm-eappp基础上,gru-eappp模型将输入门和遗忘门整合成单一的更新门,采用重置门r和更新门u控制隐状态h
t
的更新和传递,计算方式如下,其中h
′
为记忆单元的中间状态。
[0067]rt
=σ(wr·
[h
t-1
,x
t
]+br)
[0068]ut
=σ(wu·
[h
t-1
,x
t
]+bu)
[0069]h′
t-1
=h
t-1
·rt
[0070]h′
t
=tanh(wh·
[h
t-1
·rt
,x
t
]+bh)
[0071]ht
=(1-u)
·ht-1
+u
·h′
t
[0072]
s5-3:gru-eappp在最后一个时间步向上输出,并连接三个维数为64、64、1的全连接层,输出次年pci预测结果pci
t+1
。
[0073]
进一步的,所属步骤s6中构建用于高速公路沥青路面使用性能预测的先验经典循环神经网络模型pk-rnn-eappp的具体为:
[0074]
s6-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面pci值作为重要特征xs,并为了减少数据归一化带来的影响,在浅层位置输入的pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份pci的差值。
[0075]
s6-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递。
[0076]
s6-3:设置循环运算单元维数为128,循环单元运算方式同步骤s3-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的pci指标进行add特征融合,即将每一维数据与pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识。
[0077]
s6-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0078]
进一步的,所述步骤s7中构建用于高速公路沥青路面使用性能预测的先验长短时神经网络模型pk-lstm-eappp的具体方法为:
[0079]
s7-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面pci值作为重要特征xs,并为了减少数据归一化带来的影响,在浅层位置输入的pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份pci的差值。
[0080]
s7-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递。
[0081]
s7-3:设置循环运算单元维数为128,循环单元运算方式同步骤s4-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的pci指标进行add特征融合,即将每一维数据与pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识。
[0082]
s7-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0083]
进一步的,所述步骤s8中构建用于高速公路沥青路面使用性能预测的先验门控循环神经网络模型pk-gru-eappp的具体方法为:
[0084]
s8-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面pci值作为重要特征xs,并为了减少数据归一化带来的影响,在浅层位置输入的pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份pci的差值。
[0085]
s8-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递。
[0086]
s8-3:设置循环运算单元维数为128,循环单元运算方式同步骤s5-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的pci指标进行add特征融合,即将每一维数据与pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识。
[0087]
s8-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0088]
进一步的,所述步骤s9中进行对比实验,选取用于高速公路沥青路面使用性能预测的性能最好的模型pk-gru-eappp的具体方法为:构建用于高速公路沥青路面使用性能预测的选择决策回归树dt-eappp、梯度提升决策树gbdt-eappp、随机森林模型rf-eappp,并开展实验对比以上九种模型,选出性能最好的用于高速公路沥青路面使用性能预测的先验门控循环单元神经网络模型pk-gru-eappp。
[0089]
有益效果:本发明与现有技术相比,基于深度学习技术实现了对高速公路沥青路面使用性能的预测,提高了预测精度、模型稳定性与泛化能力,可可对高速公路养护决策提供技术支撑。
附图说明
[0090]
图1为高速公路路面养护数据三维信息矩阵示意图。
[0091]
图2为用于高速公路沥青路面使用性能预测的先验门控循环单元神经网络模型pk-gru-eappp结构示意图。
具体实施方式
[0092]
下面结合附图和具体实施例,进一步阐明本发明。
[0093]
本发明提供基于先验循环神经网络的高速公路沥青路面使用性能预测方法,包括以下步骤:
[0094]
s1:构建高速公路路面养护信息矩阵,其具体为:
[0095]
s1-1:收集高速公路路面养护数据,包括对高速公路基础特征信息描述的技术等级、路面结构、管养单位、起终点桩号、车道、建成年份、交通量和气象数据等;对高速公路路面使用性能描述的路面破损指数(pci)、路面行驶质量指数(rqi)、路面车辙指数(rdi)、路面抗滑性能指数(sri)、路面磨耗指数(pwi)、路面跳车指数(pbi)、结构强度指数(pssi)等;对高速公路历史养护情况描述的病害起止桩号、病害名称、病害长度等。
[0096]
s1-2:对不同来源、不同格式的高速公路路面养护数据进行抽取、转换、加载,构建信息矩阵,构建后每年数据样本共486条,2014年至2020年共7年,按时序组织的数据维度为(7,486,x),展开后共有3402条数据:
[0097]
①
确定索引数据,构建信息表。本发明选用1千米作为路段单元长度,即单位样本的高速公路路段长度。数据表的索引数据设置为“起点桩号-终点桩号-上下行-车道”。同时,为了便于索引,将起终点桩号的“k...+...”转换为整型数值,例如“k80+300”转换为“80300”。
[0098]
②
手动输入数据。针对数据量小、来源简单的高速公路路面养护数据,通过手动输入的方式将高速公路路面养护数据从不同的来源收集到一个数据表中,如气候数据、建成
时间、路龄、路面结构等,此类数据通常无需更新或更新频率低。
[0099]
③
批量加载。对来大批量高速公路路面养护数据,将数据从不同来源中抽取出来并经过一系列转换和整合加载到数据库中,其中来源包括定期检测报告、施工图设计表、病害明细表、交通量调查表等。对于结构化数据,可以通过数据读取和数据格式转换,并根据其与索引数据的对应关系进行匹配,加载到数据表中。对于非结构化数据,采用字符分割的方法明确每一部分的含义,例如,对于施工图设计表,其路段的位置信息形式如“下行k47+000-k50+000”,可以将字符串依据“k”、“+”及
“‑”
分割为五个部分,表征上下行、起终点位置信息,从而找到对应的索引数据。同时,对于不同病害类型与养护方案的表述,例如“横裂”、“横缝”和“横向裂缝”,采用字符分割和模糊匹配的方式将其转换成统一的表述,例如将“横、纵缝”转化为[
‘
横裂’,
‘
纵裂’],并通过与索引数据进行匹配,从而加载到数据表中。
[0100]
④
构建信息矩阵。对于每个路段单元每一年的数据作为特征向量,路段单元数据基于空间坐标进行堆叠,形成二维信息矩阵。之后考虑时间维度,根据高速公路的时间顺序构建基于时序的三维信息矩阵。
[0101]
s1-3:对高速公路路面养护数据进行预处理:
[0102]
①
独热编码。对于状态较少的特征使用独热编码,例如上下行、车道特征,“上行、一车道”转换为[1,0,1,0,0]。
[0103]
②
标签编码。首先通过对陕西高速公路路面结构、病害类型数据的分词、组合、去重,生成以下词汇表:{'ac':0,'中':5,'二灰':6,'细':19,'atb':1,'粗':17,'sma':3,'微表处脱落':11,'水泥':14,'路面抗滑性能不足':22,'裂缝':21,'坑槽':9,'sbs':2,'纵裂':18,'车辙':23,'横裂':13,'修补':7,'拥包':12,'唧浆':8,'密集横缝':10,'沉陷':15,'网裂':20,'烧毁':16,'下沉':4},再根据词汇表将文本数据映射为数值型数据。若高速公路不同路段的病害类型数量不同导致转换后无法得到相同长度的特征向量,则进行padding操作再后面补0,使得数据可以对齐,转换后的数据形势如:[1,19,3,17,6,13,18,23,0,0,0,0]。
[0104]
③
缺失值处理。高速公路路面养护数据中,路面使用性能数据、交通量数据、气候数据等都是时间序列数据上的连续变量,如有缺失,可采用插值法来填补缺失值;对于养护措施等类别型数据,可将缺失值视为一个新的类别;对于其他空值,可采用占位符进行填充。
[0105]
④
异常值检测。本发明使用四分位距(iqr)检测法进行高速公路路面养护数据异常值处理。首先计算数据的第三四分位数q3、第一四分位数q1和中位数;其次计算箱子高度iqr=q
3-q1;再次确定异常值范围,上限为q3+1.5
×
iqr,下限为q1-1.5
×
iqr;最后将超出该范围的数据点看作异常值进行剔除。
[0106]
⑤
数据归一化。为避免模型对不同量级的特征赋予不同权重,相对削弱数值较小特征的作用,因此采用最大最小标准化进行缩放:
[0107][0108]
⑥
数据标准化。为将数据分布调整为标准正态分布便于后续机器学习模型的使用,采用z-score方法进行数据标准化,其中,μ为所有样本均值,σ为所有样本标准差:
[0109][0110]
s1-4:各模型训练前,按照3:1比例随机抽取图像数据划分训练集和测试集。
[0111]
s2:对高速公路沥青路面使用性能衰变特点与影响因素进行分析并选取相关特征:
[0112]
s2-1:新建或新大修的高速公路,在荷载、环境等因素作用下的路面衰变比较稳定,因此高速公路沥青路面使用性能借鉴标准衰变方程:
[0113]
ppi=ppi0{1-exp[-(a/t)b]}
[0114]
其中通过a、b的不同取值拟合凹形、凸性、反s形及先快速衰变后稳定型四种典型的高速公路路面使用性能变化曲线。
[0115]
s2-2:选取预测模型特征如下:混合当量、客货比、路龄、上下行、车道特征、年平均降水、年平均温度、最高温、最低温、路面结构、养护方案、pci历史数据、pqi、sri、rqi、rdi。
[0116]
s2-3:将高速公路养护数据输入决策树中,基于当年数据预测次年高速公路路面pci,并根据决策树对特征重要度评分函数,计算个特征对未来高速公路路面使用性能影响,对各特征进行重要度排序。
[0117]
s3:构建用于高速公路沥青路面使用性能预测的经典循环神经网络模型rnn-eappp:
[0118]
s3-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数。
[0119]
s3-2:设置rnn-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态。隐状态具体传递方式为:
[0120]ht
=f(wix
t
+whh
t-1
+b)
[0121]
其中,f为激活函数,一般选用tanh,wi为输入节点与隐状态之间的权重矩阵,wh为隐状态之间的权重矩阵。
[0122]
s3-3:rnn-eappp在最后一个时间步向上输出,输出方式为:
[0123]yt
=g(w
oht
)
[0124]
s3-4:rnn-eappp向上输出后连接三个维数分别为64、64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0125]
s4:建用于高速公路沥青路面使用性能预测的长短时神经网络模型lstm-eappp:
[0126]
s4-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数。
[0127]
s4-2:设置lstm-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态,具体计算方式如下:
[0128]
①
在循环单元中设置遗忘门f查看h
t-1
和x
t
来输出一个[0,1]之间的向量,用于表示细胞状态c
t-1
中的信息的保留和丢弃,计算方式下,其中为sigmoid激活函数:
[0129]ft
=σ(wf·
[h
t-1
,x
t
]+bf)
[0130]
②
在循环单元中设置输入门i用于控制信息更新,h
t-1
和x
t
进入输入门后将得到决定要更新的信息i
t
,以及当前循环单元的状态计算方式如式下,其中tanh为激活函数:
lstm-eappp:
[0155]
s7-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面pci值作为重要特征xs,并为了减少数据归一化带来的影响,在浅层位置输入的pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份pci的差值。
[0156]
s7-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递。
[0157]
s7-3:设置循环运算单元维数为128,循环单元运算方式同步骤s4-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的pci指标进行add特征融合,即将每一维数据与pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识。
[0158]
s7-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0159]
s8:构建用于高速公路沥青路面使用性能预测的先验门控循环神经网络模型pk-gru-eappp:
[0160]
s8-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面pci值作为重要特征xs,并为了减少数据归一化带来的影响,在浅层位置输入的pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份pci的差值。
[0161]
s8-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递。
[0162]
s8-3:设置循环运算单元维数为128,循环单元运算方式同步骤s5-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的pci指标进行add特征融合,即将每一维数据与pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识。
[0163]
s8-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年pci预测结果pci
t+1
。
[0164]
s9:进行对比实验,基于已建立的高速公路养护数据信息矩阵,选取relu为激活函数,adam为优化器进行实验;选取mae、huber、rsme三种损失函数进行实验,各损失函数计算方式如下:
[0165]
mae为平均绝对误差,其中e
t
为真实值与预测值之差,优势在于受离群点的影响较小,同时可以直观地反映预测值与真实值之间的差值。
[0166][0167]
rsme为均方根误差,是均方差开根号的结果,使得损失值和样本同量纲,并且和mse一样容易偏向离群值
[0168][0169]
huber损失对数据中的异常点不如mse敏感,误差大时huber趋向于mae,当误差小时,损失huber会变为mse,这意味着huber结合了mae、mse的优点,对异常值更加鲁棒。
[0170][0171]
模型评价时,选取预测值和真实值之间的平均绝对误差mae和均方根误差rmse两个指标,其数值越小说明预测值与真实值越接近,并选用相关系数r2表现数据拟合程度,r2越接近1代表模型对数据的解释效果越好。
[0172]
向各模型导入未经训练的测试集,在不同损失函数下实验结果如下:
[0173]
表1不同损失函数下循环神经网络模型在测试集上的实验结果
[0174][0175][0176]
mae:平均绝对误差;rsme:均方根误差;r2:相关系数
[0177]
由表格可知,当采用未加先验信息的模型时,gru-eappp模型的效果优于rnn-eappp和lstm-eappp两种模型,gru-eappp模型的r2在0.73左右;增加先验信息后,pk-rnn-eappp、pk-lstm-eappp、pk-gru-eappp三种先验循环神经网络预测模型的r2在0.82~0.84之间,模型的精度有明显的提升,pk-gru-eappp模型的精度和稳定性略优于pk-rnn-eappp和pk-lstm-eappp。横向对比损失函数的表现可知,huber优于mae和rmse,采用huber损失函数的预测模型在测试集上mae最好为2.12,rmse最好为2.70,r2最高达到了0.839。
[0178]
为对比分析本文构建的高速公路沥青路面使用性能预测模型和其他数据驱动的机器学习模型在高速公路沥青路面使用性能预测方面的优势,本发明进一步构建了用于高速公路沥青路面使用性能预测的选择决策回归树dt-eappp、梯度提升决策树gbdt-eappp、随机森林模型rf-eappp,并开展了对比实验,各模型在测试集上表现如表2所示,可以看出
本发明构建的pk-gru-eappp模型性能优于dt-eappp、gbdt-eappp、rf-eappp三种预测模型,其mae、rmse、r2分别为2.12、2.70、0.839。
[0179]
表2各模型在测试集上的表现
[0180][0181]
本发明方案所公开的技术手段不仅限于上述实施方式所公开的技术手段,还包括由以上技术特征任意组合所组成的技术方案。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
技术特征:
1.基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:包括如下步骤:s1:构建高速公路路面养护信息矩阵;s2:对高速公路沥青路面使用性能衰变特点与影响因素进行分析并选取相关特征;s3:构建用于高速公路沥青路面使用性能预测的经典循环神经网络模型rnn-eappp;s4:构建用于高速公路沥青路面使用性能预测的长短时神经网络模型lstm-eappp;s5:构建用于高速公路沥青路面使用性能预测的门控循环单元神经网络模型gru-eappp;s6:构建用于高速公路沥青路面使用性能预测的先验经典循环神经网络模型pk-rnn-eappp;s7:构建用于高速公路沥青路面使用性能预测的先验长短时神经网络模型pk-lstm-eappp;s8:构建用于高速公路沥青路面使用性能预测的先验门控循环单元神经网络模型pk-gru-eappp;s9:进行对比实验,选取用于高速公路沥青路面使用性能预测的性能最好的模型pk-gru-eappp。2.根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s1中构建高速公路路面养护信息矩阵的具体方法如下:s1-1:收集高速公路路面养护数据,包括对高速公路基础特征信息描述的技术等级、路面结构、管养单位、起终点桩号、车道、建成年份、交通量和气象数据;对高速公路路面使用性能描述的路面破损指数pci)、路面行驶质量指数rqi、路面车辙指数rdi、路面抗滑性能指数sri、路面磨耗指数pwi、路面跳车指数pbi、结构强度指数pssi;对高速公路历史养护情况描述的病害起止桩号、病害名称、病害长度;s1-2:对不同来源、不同格式的高速公路路面养护数据进行抽取、转换、加载,构建信息矩阵;s1-3:对高速公路路面养护数据进行预处理;s1-4:各模型训练前,随机抽取图像数据划分训练集和测试集;所述步骤s1-2中构建信息矩阵的具体内容为:
①
确定索引数据,构建信息表;选用1千米作为路段单元长度,即单位样本的高速公路路段长度;数据表的索引数据设置为“起点桩号-终点桩号-上下行-车道”;同时,为了便于索引,将起终点桩号的“k...+...”转换为整型数值;
②
手动输入数据;针对数据量小、来源简单的高速公路路面养护数据,通过手动输入的方式将高速公路路面养护数据从不同的来源收集到一个数据表中,包括气候数据、建成时间、路龄、路面结构,此类数据无需更新或更新频率低;
③
批量加载;对来大批量高速公路路面养护数据,将数据从不同来源中抽取出来并经过一系列转换和整合加载到数据库中,其中来源包括定期检测报告、施工图设计表、病害明细表、交通量调查表;对于结构化数据,通过数据读取和数据格式转换,并根据其与索引数据的对应关系进行匹配,加载到数据表中;于非结构化数据,采用字符分割的方法明确每一部分的含义,表征上下行、起终点位置信息,从而找到对应的索引数据;同时,对于不同病害
类型与养护方案的表述,采用字符分割和模糊匹配的方式将其转换成统一的表述,并通过与索引数据进行匹配,从而加载到数据表中;
④
构建信息矩阵;对于每个路段单元每一年的数据作为特征向量,路段单元数据基于空间坐标进行堆叠,形成二维信息矩阵;之后考虑时间维度,根据高速公路的时间顺序构建基于时序的三维信息矩阵;所述步骤s1-3中高速公路路面养护数据预处理的具体内容为:
①
独热编码;对于状态较少的特征使用独热编码;
②
标签编码;首先通过对陕西高速公路路面结构、病害类型数据的分词、组合、去重,生成以下词汇表:{'ac':0,'中':5,'二灰':6,'细':19,'atb':1,'粗':17,'sma':3,'微表处脱落':11,'水泥':14,'路面抗滑性能不足':22,'裂缝':21,'坑槽':9,'sbs':2,'纵裂':18,'车辙':23,'横裂':13,'修补':7,'拥包':12,'唧浆':8,'密集横缝':10,'沉陷':15,'网裂':20,'烧毁':16,'下沉':4},再根据词汇表将文本数据映射为数值型数据;若高速公路不同路段的病害类型数量不同导致转换后无法得到相同长度的特征向量,则进行padding操作再后面补0,使得数据可以对齐;
③
缺失值处理;高速公路路面养护数据中,路面使用性能数据、交通量数据、气候数据都是时间序列数据上的连续变量,如有缺失,可采用插值法来填补缺失值;对于养护措施类别型数据,可将缺失值视为一个新的类别;对于其他空值,可采用占位符进行填充;
④
异常值检测;使用四分位距iqr检测法进行高速公路路面养护数据异常值处理;首先计算数据的第三四分位数q3、第一四分位数q1和中位数;其次计算箱子高度iqr=q
3-q1;再次确定异常值范围,上限为q3+1.5
×
iqr,下限为q1-1.5
×
iqr;最后将超出该范围的数据点看作异常值进行剔除;
⑤
数据归一化;为避免模型对不同量级的特征赋予不同权重,相对削弱数值较小特征的作用,因此采用最大最小标准化进行缩放:
⑥
数据标准化;为将数据分布调整为标准正态分布便于后续机器学习模型的使用,采用z-score方法进行数据标准化,其中,μ为所有样本均值,σ为所有样本标准差:3.根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s2中对高速公路沥青路面使用性能衰变特点与影响因素进行分析并选取相关特征的具体内容为:s2-1:新建或新大修的高速公路,在荷载、环境因素作用下的路面衰变比较稳定,因此高速公路沥青路面使用性能借鉴标准衰变方程:ppi=ppi0{1-exp[-(a/t)
b
]}其中通过a、b的不同取值拟合凹形、凸性、反s形及先快速衰变后稳定型四种典型的高速公路路面使用性能变化曲线;s2-2:选取预测模型特征如下:混合当量、客货比、路龄、上下行、车道特征、年平均降
水、年平均温度、最高温、最低温、路面结构、养护方案、路面破损指数pci历史数据、路面技术状况指数pqi、路面抗滑性能指数sri、路面行驶质量指数rqi、路面车辙指数rdi;s2-3:将高速公路养护数据输入决策树中,基于当年数据预测次年高速公路路面破损指数pci,并根据决策树对特征重要度评分函数,计算个特征对未来高速公路路面使用性能影响,对各特征进行重要度排序。4.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s3中构建用于高速公路沥青路面使用性能预测的经典循环神经网络模型rnn-eappp的具体内容为:s3-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数;s3-2:设置rnn-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态;隐状态具体传递方式为:h
t
=f(w
i
x
t
+w
h
h
t-1
+b)其中,f为激活函数,一般选用tanh,w
i
为输入节点与隐状态之间的权重矩阵,w
h
为隐状态之间的权重矩阵;s3-3:rnn-eappp在最后一个时间步向上输出,输出方式为:y
t
=g(w
o
h
t
)s3-4:rnn-eappp向上输出后连接三个维数分别为64、64和1的全连接层,输出次年路面破损指数pcl预测结果pci
t+1
。5.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s4中构建用于高速公路沥青路面使用性能预测的长短时神经网络模型lstm-eappp的具体内容为:s4-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数;s4-2:设置lstm-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态;s4-3:lstm-eappp在最后一个时间步向上输出,并连接三个维数为64、64、1的全连接层,输出次年路面破损指数pci预测结果pci
t+1
;所述步骤s4-2中每个循环单元传递隐状态的计算方式为:
①
在循环单元中设置遗忘门f查看h
t-1
和x
t
来输出一个[0,1]之间的向量,用于表示细胞状态c
t-1
中的信息的保留和丢弃,计算方式下,其中为sigmoid激活函数:f
t
=σ(w
f
·
[h
t-1
,x
t
]+b
f
)
②
在循环单元中设置输入门i用于控制信息更新,h
t-1
和x
t
进入输入门后将得到决定要更新的信息i
t
,以及当前循环单元的状态计算方式如式下,其中tanh为激活函数:i
t
=σ(w
i
·
[h
t-1
,x
t
]+b
i
)
③
更新核状态c
t
,计算方式如下:
④
根据h
t-1
和x
t
得到循环单元当前时刻的输出,更新规则如下:
o
t
=σ(w
o
[h
t-1
,x
t
]+b
o
)
⑤
根据当前核状态c
t
更新当前隐状态h
t
,计算方式如下:h
t
=o
t
·
tanh(c
t
)6.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s5中构建用于高速公路沥青路面使用性能预测的门控循环神经网络模型gru-eappp的具体内容为:s5-1:输入维度为(t、x)的高速公路养护数据,其中t为时间步,x为高速公路每个路段样本的特征维数;s5-2:设置gru-eappp模型128个循环单元,每个循环单元在时间步之间依次传递隐状态;在lstm-eappp基础上,gru-eappp模型将输入门和遗忘门整合成单一的更新门,采用重置门r和更新门u控制隐状态h
t
的更新和传递,计算方式如下,其中h
′
为记忆单元的中间状态;r
t
=σ(w
r
·
[h
t-1
,x
t
]+b
r
)u
t
=σ(w
u
·
[h
t-1
,x
t
]+b
u
)h
′
t-1
=h
t-1
·
r
t
h
′
t
=tanh(w
h
·
[h
t-1
·
r
t
,x
t
]+b
h
)h
t
=(1-u)
·
h
t-1
+u
·
h
′
t
s5-3:gru-eappp在最后一个时间步向上输出,并连接三个维数为64、64、1的全连接层,输出次年路面破损指数pci预测结果pci
t+1
。7.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s6中构建用于高速公路沥青路面使用性能预测的先验经典循环神经网络模型pk-rnn-eappp的具体内容为:s6-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面破损指数pci值作为重要特征x
s
,并为了减少数据归一化带来的影响,在浅层位置输入的路面破损指数pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份路面破损指数pci的差值;s6-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递;s6-3:设置循环运算单元维数为128,循环单元运算方式同步骤s3-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的路面破损指数pci指标进行add特征融合,即将每一维数据与路面破损指数pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识;s6-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年路面破损指数pci预测结果pci
t+1
。8.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s7中构建用于高速公路沥青路面使用性能预测的先验长短时神经网络模型pk-lstm-eappp的具体内容为:s7-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面破损指数pci值作为重要特征x
s
,并为了减少数据归一化带来的影响,在浅层位置输入的路面破损指数pci值是
未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份路面破损指数pci的差值;s7-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递;s7-3:设置循环运算单元维数为128,循环单元运算方式同步骤s4-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的路面破损指数pci指标进行add特征融合,即将每一维数据与路面破损指数pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识;s7-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年路面破损指数pci预测结果pci
t+1
。9.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:所述步骤s8中构建用于高速公路沥青路面使用性能预测的先验门控循环神经网络模型pk-gru-eappp的具体内容为:s8-1:基于步骤s2-3中特征重要度排序的结果,选取高速公路路面破损指数pci值作为重要特征x
s
,并为了减少数据归一化带来的影响,在浅层位置输入的路面破损指数pci值是未经归一化之前的,使得添加先验知识之前的网络结构的作用近似于学习预测年份与当前年份路面破损指数pci的差值;s8-2:模型输入维度为(t,x),其中x为每个路段样本的特征维数,t为时间步,时间步之间隐状态依次传递;s8-3:设置循环运算单元维数为128,循环单元运算方式同步骤s5-2,仅在最后一个时间步向上输出,采用64维的全连接层进行进一步的特征提取,并与最后一个时间步输入的路面破损指数pci指标进行add特征融合,即将每一维数据与路面破损指数pci指标相加,总特征维数不变,相当于给模型加入了一个先验知识;s8-4:add特征融合完成后连接两个维度为64和1的全连接层,输出次年路面破损指数pci预测结果pci
t+1
。10.根据根据权利要求1所述的基于先验循环神经网络的高速公路沥青路面使用性能预测方法,其特征在于:构建用于高速公路沥青路面使用性能预测的选择决策回归树dt-eappp、梯度提升决策树gbdt-eappp、随机森林模型rf-eappp,并开展实验对比以上九种模型,选出性能最好的用于高速公路沥青路面使用性能预测的先验门控循环单元神经网络模型pk-gru-eappp。
技术总结
本发明公开了基于先验循环神经网络的高速公路沥青路面使用性能预测方法,包括:构建高速公路路面养护信息矩阵;对高速公路沥青路面使用性能衰变特点与影响因素进行分析,并选取相关特征;构建经典循环神经网络模型RNN-EAPPP;构建长短时神经网络模型LSTM-EAPPP;构建门控循环单元神经网络模型GRU-EAPPP;构建先验经典循环神经网络模型PK-RNN-EAPPP;构建先验长短时神经网络模型PK-LSTM-EAPPP;构建先验门控循环单元神经网络模型PK-GRU-EAPPP;进行对比实验,选取性能最好的模型PK-GRU-EAPPP。本发明提出高速公路路面养护信息矩阵构建方法并构建用于高速公路沥青路面使用性能预测模型,对道路养护的数字化、智能化发展具有重要意义。具有重要意义。具有重要意义。
技术研发人员:赵池航 张子怡 刘洋
受保护的技术使用者:东南大学
技术研发日:2023.06.25
技术公布日:2023/9/25
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/