一种轨道交通新线客流预测方法、系统、电子设备及介质
未命名
09-23
阅读:46
评论:0
1.本发明涉及轨道交通客流预测领域,特别是涉及一种轨道交通新线客流预测方法、系统、电子设备及介质。
背景技术:
2.为了适应新线车站运营需要,向城市轨道交通规划与管理提供科学依据,在新线开通近前期构建准确、快速响应的客流预测方法极为迫切。目前轨道交通新线客流预测方法主要有以下不足:在轨道交通客流影响因素选取方面,考虑的建成环境特征不够综合和全面,数据层面的精细化和全面性有待提高;新线客流预测模型如四阶段法存在各环节参数多、响应速度慢、预测精度较低的不足,其他直接需求预测法则未将建成环境特征的时空异质性与非线性影响融合考虑,因此也具有精度不高、适应性不强的局限。
技术实现要素:
3.本发明的目的是提供一种轨道交通新线客流预测方法、系统、电子设备及介质,以提高轨道交通客流预测的精度。
4.为实现上述目的,本发明提供了如下方案:
5.一种轨道交通新线客流预测方法,包括:
6.获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性;
7.根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型;
8.利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据;
9.利用地理加权回归模型确定所述客流预测子模型的预测残差;
10.根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流。
11.可选地,利用训练数据集对机器学习模型进行训练,具体包括:
12.获取所述训练数据集;
13.根据所述空间区位和车站类型对所述训练数据集进行分组,得到多个训练数据子
集;一个所述训练数据子集对应至少一种车站类型;
14.对每个所述训练数据子集进行特征筛选,得到多个筛选后的训练数据子集;
15.利用每个所述筛选后的训练数据子集分别对所述机器学习模型进行训练,得到多个客流预测子模型;一个客流预测子模型对应至少一种车站类型。
16.可选地,根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型,具体包括:
17.确定所述新线车站的建成环境特征和既有车站的建成环境特征的欧氏距离;
18.根据所述欧氏距离,确定所述新线车站的车站类型;所述新线车站的车站类型为最小欧式距离对应的既有车站的车站类型。
19.可选地,利用地理加权回归模型确定所述客流预测子模型的预测残差,具体包括:
20.利用地理加权回归模型确定所述客流预测子模型的预测残差;其中,(ui,vi)为站点i的空间坐标;β0(ui,vi)为截距;βk(ui,vi)为因变量与解释变量之间的回归系数;k为建成环境特征的数量;ei为客流预测子模型在站点i的预测残差;x
ik
为站点i的建成环境特征矩阵;εi为站点i预测残差的误差项。
21.可选地,根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流,具体包括:
22.利用公式v(s,t)=m(s,t)+e(s,t),确定所述新线车站的最终客流;其中,m(s,t)为t时刻站点s的初步预测客流;e(s,t)为t时刻站点s的预测残差;v(s,t)为新线车站的最终客流。
23.一种轨道交通新线客流预测系统,包括:
24.数据获取模块,用于获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性;
25.车站类型确定模块,用于根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型;
26.初步预测模块,用于利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据;
27.预测残差确定模块,用于利用地理加权回归模型确定所述客流预测子模型的预测残差;
28.客流确定模块,用于根据所述初步预测客流和所述预测残差,确定所述新线车站
的最终客流。
29.一种电子设备,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行上述的轨道交通新线客流预测方法。
30.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的轨道交通新线客流预测方法。
31.根据本发明提供的具体实施例,本发明公开了以下技术效果:
32.本发明提供的轨道交通新线客流预测方法、系统、电子设备及介质,首先获取与车站客流相关的建成环境特征,利用客流预测子模型对新线车站的客流进行初步预测,其中,客流预测子模型是利用训练数据集对机器学习模型进行训练得到的,训练数据集包括既有车站的建成环境特征和对应的不同时段客流数据;再利用地理加权回归模型确定客流预测子模型对新线车站客流进行初步预测的预测残差;最后将初步预测结果和预测残差求和,得到新线车站的最终客流。本发明依据轨道交通多源数据,探索客流与建成环境特征的对应规律,捕捉建成环境对客流非线性影响时融合线性模型的时空异质性,提高进出站客流预测精准度,有效支撑新线车站的运营管理。
附图说明
33.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
34.图1为本发明提供的轨道交通新线客流预测方法流程图;
35.图2为本发明的客流预测子模型训练流程图;
36.图3为gwr模型修正前后残差分布图;
37.图4为轨道交通新线客流预测方法工作流程图;
38.图5为某组别工作日、周末全天进站量预测特征筛选及重要度排序示意图。
具体实施方式
39.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
40.本发明的目的是提供一种轨道交通新线客流预测方法、系统、电子设备及介质,以提高轨道交通客流预测的精度。
41.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
42.实施例一
43.如图1所示,本发明提供的轨道交通新线客流预测方法,包括:
44.步骤101:获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质
特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性。
45.步骤102:根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型。
46.步骤103:利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据。
47.步骤104:利用地理加权回归模型确定所述客流预测子模型的预测残差。
48.步骤105:根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流。
49.在实际应用中,如图2所示,利用训练数据集对机器学习模型进行训练,具体包括:
50.s1:获取所述训练数据集。在实际应用中,首先获取既有车站的建成环境特征和既有车站客流数据,建立车站建成环境特征体系。
51.具体的,利用python语言通过高德地图及链家网站api提取上述五类建成环境特征,应用gis空间处理技术进行建成环境特征的筛选、融合、统计,用poi(point ofinterest,信息点)数量表征土地利用性质,包括政府机构数量、写字楼数量、住宅区数量、风景名胜数量、休闲娱乐场所数量等,经过剔除“门”等无用字段和重复字段后剩下符合要求的poi;根据经纬度将和居住、就业性质相关的住宅poi、写字楼poi与建筑面积数据结合,形成有面积、类型、名称的矢量,得到建筑面积数据;根据位置与名称将获取的小区房价信息与住宅poi信息融合,设定匹配值为90%;使用python编程语言构建轨道交通车站拓扑网络,利用networkx的内置函数计算各车站的介数和度指标;gis中利用邻域分析选项的点距离计算各车站到市中心距离,将北京市中心点位置坐标输入转成shp文件,各车站位置坐标转成的shp文件作为邻近要素输入,生成各车站到市中心的距离;gis中空间连接统计吸引范围内轨道交通站点的个数;将爬取的公交站poi全部导入gis中,进一步统计范围内公交线路条数;gis中对城市一级、二级、三级、四级道路长度属性求和,统计范围内总道路长度,用其与范围面积之比得到道路密度。同时对afc数据进行清洗统计得到客流数据,为了符合模型前提设定,使其表现出良好的数据处理能力,对客流数据正态化处理,做出开平方根或取对数的预处理,矫正其分布的左偏或右偏状态。
52.在本实施方式中,车站建成环境特征体系表征车站周边包含大型城市环境在内的人类活动所提供环境的概念,主要包括土地利用性质特征、区域社会经济特征、车站自身特征、外部交通特征和空间区位特征。
53.进一步地,在本实施方式中,站点吸引范围是指街道路网的步行接驳和等时圈的公交接驳两种方式作用下的圈层范围,站点m周边的某特征变量数值表示为:
54.cm=c
m1
+θ
·cm2
。
55.其中,c
m1
为步行接驳范围内的某特征数量,c
m2
为公交接驳与步行接驳之间范围内的某特征数量,θ与各城市轨道交通服务的规模、建筑布局、发展水平等相关,本实施例中θ为0.35。
56.进一步地,在本实施方式中,就业与居住密度是基于百度热力图显示的实时人口活跃度,结合landscan全球人口统计数据校正而获取的,区分工作日和周末。
57.截取站点吸引范围一周内10点和23点百度热力图共14幅,坐标配准后,使用栅格工具中的镶嵌至新栅格命令分别按照工作日和周末进行融合平均。
58.利用栅格计算器对tif格式的图片文件加载的第一、二、三通道(band)波段赋表达式重新计算,重分类为7类,分别对应红色、橙色、黄色、绿色、青色、浅蓝色、紫色7个颜色alpha值区间,将生成的栅格文件value值改为对应的聚集密度,分别为》60(人/hm2)、40-60(人/hm2)、20-40(人/hm2)、10-20(人/hm2)、《10(人/hm2)、缺省、缺省。
59.利用栅格转面工具将栅格转为矢量图层,在该图层上创建网格面积为100m
×
100m的渔网矢量。
60.将渔网矢量文件与转成的面矢量图层依据密度属性进行空间连接,赋予渔网矢量密度值,根据计算几何生成每个网格的面积,统计站点影响范围内网格总和得到人口活跃数,公式为:
[0061][0062]
其中,ai为人口活跃数,dc为聚集密度,si为网格面积。
[0063]
将landscan人口tiff文件转换为矢量格式,空间连接统计各站点影响范围内人口数量。
[0064]
美国能源部橡树岭国家实验室的landscan全球人口统计数据,它采用空间数据、图像分析技术和多元分区密度模型算法在特定的行政边界范围内对每个国家或地区人口普查数据解析,其tiff文件可以投影到gis软件。
[0065]
结合处理后的人口占比,修正人口活跃数,得到工作日、周末的居住与就业密度。
[0066]
利用热力图提取的人口居住和就业密度示例如表1所示。
[0067]
表1人口居住和就业密度示例表
[0068]
车站居住密度(人/hm2)就业密度(人/hm2)崇文门37.7510.18西单66.365.48花乡东桥3.540.54
[0069]
在本实施方式中,所述站点的空间方位划分规则为:以城市中心点为轨道路网中心点,计算各站点经纬度坐标与中心点经纬度坐标的方位角,分别赋予东、南、西、北、东北、东南、西北、西南八个区位标签。
[0070]
此外,在本实施方式中,车站建成环境特征体系的具体格式如表2所示:
[0071]
表2车站建成环境特征体系的具体格式表
[0072][0073]
在本实施方式中,车站建成环境特征体系更新规则为:数据于新线开通的前一年采集,预测年为新线开通首年,由于两者时间间隔短,所以认为车站周边土地利用等建成环境数据几乎未发生改变,但是由于新线车站影响整个轨道交通线网拓扑结构发生改变,因此更新对应的拓扑指标度、介数,此外可以按照需求根据百度热力图定时更新所用的近期居住与就业密度。
[0074]
s2:根据所述空间区位和车站类型对所述训练数据集进行分组,得到多个训练数据子集;一个所述训练数据子集对应至少一种车站类型。在实际应用中,基于客流序列与建
成环境对既有车站分类,得到各类的建成环境特征,依据建成环境将新线车站匹配至对应组别。
[0075]
车站类型通过客流序列与建成环境共同确定,包括工作日、周末双重类型,方法为:
[0076]
依靠知识驱动把与旅游景点、交通枢纽有关的车站数据提取出来,定义两种类型。
[0077]
对剩下车站标准化的工作日客流数据使用k-means聚类法进行类型划分,聚类数k值依据和方差sse指标初步确定,同时计算轮廓系数和ch指数(calinski-harabaz index),综合上述三个指标确定聚类数为6,对周末客流数据做出同样的处理,聚类数也为6。
[0078]
分析每一聚类的建成环境特征,对其用min-max法做标准化处理,使该值映射到[0,1],划分不同等级,结合上述建成环境反映的用地功能给车站工作日、周末类别命名。
[0079]
具体地,对应的车站工作日类型为:远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型及交通枢纽型;对应的车站周末类型为:综合型、商业娱乐型、就业主导型、混合偏就业型、居住主导型、混合偏居住型、旅游景点型及交通枢纽型。
[0080]
s3:对每个所述训练数据子集进行特征筛选,得到多个筛选后的训练数据子集。
[0081]
针对以空间区位标签为主要依据、类型标签为辅助依据划分的车站组别,训练工作日、周末各时段客流的gbrt机器学习子模型(机器学习模型),通过特征重要度排序筛选各组的建成环境特征,进行超参数调整,得到初步预测结果。
[0082]
由于考虑的建成环境特征较多,各建成环境特征之间难免存在相关性,冗余特征添加了模型的噪声,因此通过计算特征重要度进行特征选择,也即影响因素的筛选。特征重要度表现了在某个子模型中各建成环境特征对客流的影响程度,利用置换重要性计算,工作原理为保持其他特征不变,将某特征数值随机排列以替换原来的顺序,对置换后的数据集重新训练并预测,得出对应的准确度得分,与置换前模型得分相比下降的差异系数即为该特征的置换重要性,各特征依次重复上述过程。通过特征递归消除,得到本子模型最优特征数量及所需具体特征。
[0083]
s4:利用每个所述筛选后的训练数据集分别对所述机器学习模型进行训练,得到多个客流预测子模型;一个客流预测子模型对应至少一种车站类型。
[0084]
gbrt算法通过最小化损失函数l(y,f(x))的期望值来更新逼近函数f(x),其中y为实际客流量值,平方误差损失函数公式为:
[0085]
l(y,f(x))=(y-f(x))2。
[0086]
基于梯度下降方向,利用m个回归树对f(x)进行更新,公式为:
[0087][0088]
ξ为0到1之间的收缩参数,通过简单的正则—缩放每棵树的贡献值以防止过拟合。c
jm
为对应区域r
jm
的常数值,r
1m
,r
2m
,
…rjm
表示输入空间被树分割为的不相交区域,ρm通过最小化损失函数的期望值来估计,公式为:
[0089][0090]
作为一种可选地实施方式,步骤102,具体包括:
[0091]
1)确定所述新线车站的建成环境特征和既有车站的建成环境特征的欧氏距离。
[0092]
在实际应用中,计算新线车站与每类既有车站建成环境特征数据平均值的欧氏距离,公式为:
[0093][0094]
其中,dj为综合距离,x
inew
表示新线车站第i个建成环境特征值,x
ijold
表示第j类车站第i个建成环境特征平均值。
[0095]
2)根据所述欧氏距离,确定所述新线车站的车站类型;所述新线车站的车站类型为最小欧式距离对应的既有车站的车站类型。
[0096]
在实际应用中,将dj作为接近程度判断标准,选取新线车站建成环境据车站类别欧氏距离最小的值作为新线车站的类别。
[0097]
在本实施方式中,例如某条新线车站与每类既有车站建成环境特征数据平均值的综合距离如表3所示,按照最小即为接近原则,则该线车站分别被归类为混合偏居住型、混合偏居住型、混合偏就业型、混合偏就业型、混合偏就业型、居住主导型。
[0098]
表3某站点与每类既有车站建成环境特征的欧氏距离统计表
[0099]
[0100][0101]
作为一种可选地实施方式,步骤104,具体包括:
[0102]
利用地理加权回归模型确定所述客流预测子模型的预测残差;其中,(ui,vi)为站点i的空间坐标;β0(ui,vi)为截距;βk(ui,vi)为因变量与解释变量之间的回归系数;k为建成环境特征的数量(自变量数,对应筛选特征);ei为机器学习子模型在站点i估计的客流量误差(客流预测子模型在站点i的预测残差);x
ik
为站点i的建成环境特征矩阵;εi为站点i预测残差的误差项。
[0103]
在实际应用中,各建成环境特征表现出明显的空间自相关性,利用gwr模型(地理加权回归模型)捕捉预测残差,公式为:
[0104][0105]
βk(ui,vi)=[x
t
w(ui,vi)x]-1
x
t
w(ui,vi)e。
[0106]
其中,w为空间权重矩阵,e为机器学习子模型估计客流量误差的向量。修正前后残差分布如图3所示,发现经gwr修正后的残差显著降低且为随机扰动。
[0107]
作为一种可选地实施方式,步骤105,具体包括:
[0108]
利用公式v(s,t)=m(s,t)+e(s,t),确定所述新线车站的最终客流;其中,m(s,t)为t时刻站点s的初步预测客流;e(s,t)为t时刻站点s的预测残差。
[0109]
将机器学习子模型(客流预测子模型)的初步预测结果与gwr估算的残差值(预测残差)求和得到最终预测结果(最终客流),预测模型具体输入输出工作流程图如图4所示。
[0110]
在本实施方式中,例如某条新线某站应用分组预测修正模型工作日实验结果如下表4所示,其预测标签为西南城区混合偏居住型,输入至对应组别和时段的建成环境特征及客流量组成的数据集中训练,其中剔除了与其差距较远的就业主导型、混合偏就业型车站相关数据,通过筛选特征、调整超参数输出最佳预测结果,该组别工作日、周末全天进站量预测特征筛选及重要度排序如图5所示,并结合地理加权回归模型修正残差,平均误差得到近15%的改善,其他绝大部分车站全天总进出站量误差集中在(-10%,10%),早晚高峰、平峰进出站量误差集中在(-35%,35%)。
[0111]
表4某条新线某站工作日客流预测结果表
[0112][0113]
本发明的轨道交通新线客流预测方法,依据轨道交通多源数据,探索客流与建成环境特征的对应规律,建立了车站建成环境特征匹配规则,有效支撑新线开通车站的功能定位与运营管理。本发明的轨道交通新线客流预测方法,较为全面地考虑并识别了影响客流的建成环境多维度因素,在捕捉各因素对客流量非线性影响的同时融合线性模型考虑时空异质性的优势,得到准确度较高的客流预测结果,满足实际生产应用。本发明提升新线客流预测精度,提高车站多源数据统计、分析可视化水平,完善轨道交通数字化基础设施建设。
[0114]
实施例二
[0115]
为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种轨道交通新线客流预测系统,包括:
[0116]
数据获取模块,用于获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度
和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性。
[0117]
车站类型确定模块,用于根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型。
[0118]
初步预测模块,用于利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据。
[0119]
预测残差确定模块,用于利用地理加权回归模型确定所述客流预测子模型的预测残差。
[0120]
客流确定模块,用于根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流。
[0121]
本发明提出的轨道交通新线客流预测智能系统,提升新线客流预测精度,提高车站多源数据统计、分析可视化水平,完善轨道交通数字化基础设施建设。
[0122]
实施例三
[0123]
本发明提供了一种电子设备,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行实施例一的轨道交通新线客流预测方法。
[0124]
实施例四
[0125]
本发明提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现实施例一的轨道交通新线客流预测方法。
[0126]
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0127]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
技术特征:
1.一种轨道交通新线客流预测方法,其特征在于,包括:获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性;根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型;利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据;利用地理加权回归模型确定所述客流预测子模型的预测残差;根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流。2.根据权利要求1所述的轨道交通新线客流预测方法,其特征在于,利用训练数据集对机器学习模型进行训练,具体包括:获取所述训练数据集;根据所述空间区位和车站类型对所述训练数据集进行分组,得到多个训练数据子集;一个所述训练数据子集对应至少一种车站类型;对每个所述训练数据子集进行特征筛选,得到多个筛选后的训练数据子集;利用每个所述筛选后的训练数据子集分别对所述机器学习模型进行训练,得到多个客流预测子模型;一个客流预测子模型对应至少一种车站类型。3.根据权利要求2所述的轨道交通新线客流预测方法,其特征在于,根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型,具体包括:确定所述新线车站的建成环境特征和既有车站的建成环境特征的欧氏距离;根据所述欧氏距离,确定所述新线车站的车站类型;所述新线车站的车站类型为最小欧式距离对应的既有车站的车站类型。4.根据权利要求1所述的轨道交通新线客流预测方法,其特征在于,利用地理加权回归模型确定所述客流预测子模型的预测残差,具体包括:利用地理加权回归模型确定所述客流预测子模型的预测残差;其中,(u
i
,v
i
)为站点i的空间坐标;β0(u
i
,v
i
)为截距;β
k
(u
i
,v
i
)为因变量与解释变量之间的回归系数;k为建成环境特征的数量;e
i
为客流预测子模型在站点i的预测残差;x
ik
为站点i的建成环境特征矩阵;ε
i
为站点i预测残差的误差项。5.根据权利要求1所述的轨道交通新线客流预测方法,其特征在于,根据所述初步预测
客流和所述预测残差,确定所述新线车站的最终客流,具体包括:利用公式v(s,t)=m(s,t)+e(s,t),确定所述新线车站的最终客流;其中,m(s,t)为t时刻站点s的初步预测客流;e(s,t)为t时刻站点s的预测残差;v(s,t)为新线车站的最终客流。6.一种轨道交通新线客流预测系统,其特征在于,包括:数据获取模块,用于获取待预测客流的新线车站的客流相关建成环境特征;所述客流相关建成环境特征是对建成环境特征进行特征筛选确定的;所述建成环境特征包括土地利用性质特征、区域社会经济特征、车站自身特征特征、外部交通特征和空间区位特征;所述土地利用性质特征包括站点吸引范围内的居住面积、办公面积、政府poi数、医院poi数、娱乐poi数、旅游poi数、教育poi数和土地利用混合度;所述区域社会经济特征包括站点吸引范围内的就业密度、居住密度和房价;所述车站自身特征包括站点的度、介数、到市中心距离、出入口数和局部轨道站点数;所述外部交通特征包括站点吸引范围内的道路密度和公交条数;所述空间区位特征包括站点的空间方位和城郊区属性;车站类型确定模块,用于根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;所述车站类型为远郊居住型、混合偏居住型、混合偏就业型、职住混合型、居住主导型、就业主导型、旅游景点型、交通枢纽型、综合型或商业娱乐型;初步预测模块,用于利用所述车站类型对应的客流预测子模型对所述新线车站的客流进行初步预测,得到初步预测客流;其中,所述客流预测子模型是利用训练数据集对机器学习模型进行训练得到的;所述训练数据集包括既有车站建成环境特征和对应的不同时段客流数据;预测残差确定模块,用于利用地理加权回归模型确定所述客流预测子模型的预测残差;客流确定模块,用于根据所述初步预测客流和所述预测残差,确定所述新线车站的最终客流。7.一种电子设备,其特征在于,包括:存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1-5任一项所述的轨道交通新线客流预测方法。8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-5任一项所述的轨道交通新线客流预测方法。
技术总结
本发明公开一种轨道交通新线客流预测方法、系统、电子设备及介质,涉及轨道交通客流预测领域,方法包括:首先获取与车站客流相关的建成环境特征,根据待预测客流的新线车站的建成环境特征,确定新线车站的车站类型;利用车站类型对应的客流预测子模型对新线车站的客流进行初步预测;其中,客流预测子模型是利用训练数据集对机器学习模型进行训练得到的,训练数据集包括既有车站的建成环境特征和对应的不同时段客流数据;再利用地理加权回归模型确定客流预测子模型对新线车站客流进行初步预测的预测残差;最后将初步预测结果和预测残差求和,得到新线车站的最终客流。本发明提高了进出站客流预测精准度。了进出站客流预测精准度。了进出站客流预测精准度。
技术研发人员:许心越 张鹏羽 李海鹰 孔庆雪
受保护的技术使用者:北京交通大学
技术研发日:2023.06.30
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种刚挠结合板压合结构的制作方法 下一篇:一种塑料管材直推式扩口模具的制作方法