基于机器学习的航路机票运价数据处理方法、系统及介质与流程

未命名 08-02 阅读:112 评论:0


1.本发明涉及数据处理技术领域,更具体的,涉及一种基于机器学习的航路机票运价数据处理方法、系统及介质。


背景技术:

2.随着我国民航业的蓬勃发展,越来越多的旅客选择飞机作为出行工具。航空公司的客运量正在快速增长,与此同时产生的航路机票运价数据也在爆炸式的增长,对航路机票运价数据的数据处理提出了挑战。长期的数据积累使得航路机票运价数据不仅数据维度较多,而且数据量较大。动态定价作为收益管理的主要技术之一,是航空公司针对不同供应水平调整机票价格,以期获得最大收益的重要手段,近年来动态定价已广泛应用于航空机票的销售中。
3.目前,大多数旅行服务提供商都是通过在为航空公司代售机票并在此基础上额外收取一笔佣金来赚取利润,许多旅行公司尝试通过基于自身行业经验来调整佣金以获得更多利润。但由于在真实世界中机票的需求和用户的行为模式十分复杂,因此专家经验等方法应用在调价决策上存在着许多缺点险评估的准确性,需要一种高效、合理的航路机票运价管理系统。因此,在航路机票运价管理中,如何利用机器学习对航路机票运价相关的数据进行处理,提取关联特进行周期性智能判断,以提高用户购买旅游产品过程中的价格准确性和成功率是亟不可待需要解决的问题。


技术实现要素:

4.为了解决上述技术问题,本发明提出了一种基于机器学习的航路机票运价数据处理方法、系统及介质。
5.本发明第一方面提供了一种基于机器学习的航路机票运价数据处理方法,包括:
6.获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;
7.根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;
8.基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;
9.获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;
10.基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。
11.本方案中,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列,具体为:
12.提取历史机票运价数据中关键词信息,根据关键词信息确定起飞城市信息及目的城市信息,提取航线信息,基于所述航线信息设置分类标签;
13.根据所述分类标签将历史机票运价数据进行分类,获取不同分类标签下的机票运价数据集,根据节假日信息及普通日信息将对应的机票运价数据进行标记;
14.对不同标记下机票运价数据进行时序分析,获取机票运价的的变化时间戳及变化差价,生成各航线的时序变化序列,获取历史机票运价的更新周期及更新频次。
15.本方案中,基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型,具体为:
16.基于大数据手段获取机票预订相关网站中各航线信息的查询量,根据航线信息的目的地信息设置异构信息检索标签,并根据各更新周期获取检索时间步长,获取异构信息的查询量;
17.设置转化系数与异构信息的查询量进行结合,将结合后的数据与各航线信息的查询量进行匹配,获取各更新周期内最终访问量,关联到时序变化序列,获取访问量与更新周期的关联特征,构建特征样本数据集;
18.基于粒子群算法优化后的lstm网络构建机票运价数据更新模型,根据lstm网络中隐藏层神经元个数、学习率及最大迭代次数设置粒子,并初始化粒子参数,并设置初始位置及速度;
19.根据均方误差设置适应度函数,根据不断更新粒子个体最优和全局最优进行粒子的位置寻优,根据粒子的最优位置确定lstm网络的参数;
20.将所述特征样本数据集按照预设比例划分为训练集与测试集,经过迭代训练后输出准确度符合预设标准的机票运价数据更新模型。
21.本方案中,通过机票运价数据更新模型获取机票运价数据的下次更新时间,具体为:
22.将多源机票运价数据进行筛选获取目标机票运价数据,提取目标机票运价数据的航线信息、时间信息及仓位信息,获取过去预设时间内的时序变化序列及访问量变化序列作为机票运价数据更新模型的输入;
23.在机票运价数据更新模型引入自注意力机制,构建自注意力层,将不同时间步长的隐藏层状态输出作为所述自注意力层的输入,计算自注意力权重;
24.通过所述自注意力权重表征各时间步长对预测目标的重要性,根据迭代计算后,输出目标机票运价数据的下次更新时间。
25.本方案中,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储,具体为:
26.根据各航线历史机票运价的时序变化序列及访问量变化序列通过数据挖掘获取机票运价的影响因素,对所述影响因素进行筛选获取过去预设时间段内影响目标机票运价的影响因素集合;
27.基于时间卷积神经网络构建机票运价预测网络,将获取的下次更新时间作为目标预测时间,将所述影响因素集合中影响因素与目标机票运价过去预设时间内的时序变化序列进行匹配,并进行归一化处理;
28.将归一化后的数据导入机票运价预测网络,获取目标预测时间的预测机票运价,
将下次更新时间及所述预测机票运价设置数据标签后进行存储。
29.本方案中,基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端,具体为:
30.获取用户的历史行为数据,根据所述历史行为数据获取预设时间步长内用户与机票项目节点的交互信息,通过所述交互信息生成用于与机票项目的二部图结构;
31.获取用户的基础信息、航段信息及提前购票时间信息,作为所述二部图结构中节点的附加特征;
32.基于图卷积神经网络对所述二部图结构进行学习表示,得到用户与机票项目的初始向量表示,将用户与机票项目的初始向量表示进行拼接,构建邻接矩阵;
33.通过图卷积神经网络的消息传递机制及邻居聚合机制,基于邻接矩阵进行节点之间的特征传递,学习邻居节点的特征,更新用户节点的嵌入表示;
34.另外,获取用户在预设时间步长内各时间戳交互的机票项目,将对应的二部图结构进行拼接,构建预设时间步长内的元路径,将所述元路径与用户进行匹配;
35.通过计算用户之间的元路径上节点的均方距离获取用户之间的相似度,将所述相似度作为注意力权重,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征;
36.根据用户的搜索信息获取对应的机票运价数据,根据用户的偏好特征结合获取的下次更新时间及预测机票运价分析机票的运价变化趋势,并查询的信息与运价变化趋势返回至用户端。
37.本发明第二方面还提供了一种基于机器学习的航路机票运价数据处理系统,该系统包括:存储器、处理器,所述存储器中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被所述处理器执行时实现如下步骤:
38.获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;
39.根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;
40.基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;
41.获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;
42.基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。
43.本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被处理器执行时,实现如上述任一项所述的一种基于机器学习的航路机票运价数据处理方法的步骤。
44.本发明公开了一种基于机器学习的航路机票运价数据处理方法、系统及介质,包
括:获取历史机票运价数据,提取各航线机票运价的时序变化序列;根据时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将访问量与时序变化序列关联;基于机器学习构建机票运价数据更新模型,获取多源机票运价数据,通过机票运价数据更新模型获取机票运价数据的下次更新时间及预测机票运价,并进行数据存储;基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。本发明通过机票运价数据进行数据处理机,获取合理的价格预测,并提高用户购买旅游产品过程中的价格准确性和成功率。
附图说明
45.图1示出了本发明一种基于机器学习的航路机票运价数据处理方法的流程图;
46.图2示出了本发明获取机票运价数据的下次更新时间的方法流程图;
47.图3示出了本发明基于用户搜索的时间戳调用存储数据中的机票运价数据的方法流程图;
48.图4示出了本发明一种基于机器学习的航路机票运价数据处理系统的框图。
具体实施方式
49.为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互组合。
50.在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
51.图1示出了本发明一种基于机器学习的航路机票运价数据处理方法的流程图。
52.如图1所示,本发明第一方面提供了一种基于机器学习的航路机票运价数据处理方法,包括:
53.s102,获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;
54.s104,根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;
55.s106,基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;
56.s108,获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;
57.s110,基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。
58.需要说明的是,提取历史机票运价数据中关键词信息,根据关键词信息确定起飞城市信息及目的城市信息,提取航线信息,基于所述航线信息设置分类标签;根据所述分类
标签将历史机票运价数据进行分类,获取不同分类标签下的机票运价数据集,根据节假日信息及普通日信息将对应的机票运价数据进行标记;对不同标记下机票运价数据进行时序分析,获取机票运价的的变化时间戳及变化差价,生成各航线的时序变化序列,获取历史机票运价的更新周期及更新频次。
59.图2示出了本发明获取机票运价数据的下次更新时间的方法流程图。
60.根据本发明实施例,通过机票运价数据更新模型获取机票运价数据的下次更新时间,具体为:
61.s202,将多源机票运价数据进行筛选获取目标机票运价数据,提取目标机票运价数据的航线信息、时间信息及仓位信息,获取过去预设时间内的时序变化序列及访问量变化序列作为机票运价数据更新模型的输入;
62.s204,在机票运价数据更新模型引入自注意力机制,构建自注意力层,将不同时间步长的隐藏层状态输出作为所述自注意力层的输入,计算自注意力权重;
63.s206,通过所述自注意力权重表征各时间步长对预测目标的重要性,根据迭代计算后,输出目标机票运价数据的下次更新时间。
64.需要说明的是,通过所述自注意力权重表征各时间步长对预测目标的重要性,所述自注意力权重的计算公式为其中,表示在t时间步隐藏层状态的注意力得分,tanh表示激活函数,w
cvc
表示自注意力层参数,bc表示偏置,t表示矩阵转置。
65.基于大数据手段获取机票预订相关网站中各航线信息的查询量,根据航线信息的目的地信息设置异构信息检索标签,并根据各更新周期获取检索时间步长,获取异构信息的查询量,所述异构信息可以通过旅行服务提供商的酒店预定信息、旅游搜索信息等获取;设置转化系数与异构信息的查询量进行结合,将结合后的数据与各航线信息的查询量进行匹配,获取各更新周期内最终访问量,所述转化系数通过某一城市历史同期时段航空客流量与总客流量的比值进行设置;将最终访问量关联到时序变化序列,获取访问量与更新周期的关联特征,构建特征样本数据集。
66.基于粒子群算法优化后的lstm网络构建机票运价数据更新模型,根据lstm网络中隐藏层神经元个数、学习率及最大迭代次数设置粒子,并初始化粒子参数,包括粒子群算法的最大迭代次数、种群规模、加速系数及惯性权重等,并设置初始位置及速度;确定lstm网络的网络结构,根据实际值与预测值的均方误差设置适应度函数,根据不断更新粒子个体最优和全局最优进行粒子的位置寻优,当更替得到的最优位置则停止寻优过程,根据粒子的最优位置确定lstm网络的参数;将所述特征样本数据集按照预设比例划分为训练集与测试集,经过迭代训练后输出准确度符合预设标准的机票运价数据更新模型。
67.需要说明的是,根据各航线历史机票运价的时序变化序列及访问量变化序列通过数据挖掘获取机票运价的影响因素,所述数据挖掘能够利用大数据手段实现,通过文献及相关资料检索、专家经验汇总等方法获取机票运价的影响因素,一般包括航班自身因素、节假日因素、星期因素等,对所述影响因素通过随机森林或者主成分分析等方法进行筛选获取过去预设时间段内影响目标机票运价的影响因素集合;基于时间卷积神经网络构建机票
运价预测网络,所述机票运价预测网络通过3个因果卷积汇成的扩张卷积网络残差快,与1个1
×
1卷积核的卷积网络组合而成,并最终通过1层全连接层输出最终的预测结果;
68.将获取的下次更新时间作为目标预测时间,将所述影响因素集合中影响因素与目标机票运价过去预设时间内的时序变化序列进行匹配,并进行归一化处理;将归一化后的数据导入机票运价预测网络,获取目标预测时间的预测机票运价,将下次更新时间及所述预测机票运价设置数据标签后进行存储。
69.图3示出了本发明基于用户搜索的时间戳调用存储数据中的机票运价数据的方法流程图。
70.根据本发明实施例,基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端,具体为:
71.s302,获取用户的历史行为数据,根据所述历史行为数据获取预设时间步长内用户与机票项目节点的交互信息,通过所述交互信息生成用于与机票项目的二部图结构;
72.s304,获取用户的基础信息、航段信息及提前购票时间信息,作为所述二部图结构中节点的附加特征;
73.s306,基于图卷积神经网络对所述二部图结构进行学习表示,得到用户与机票项目的初始向量表示,将用户与机票项目的初始向量表示进行拼接,构建邻接矩阵;
74.s308,通过图卷积神经网络的消息传递机制及邻居聚合机制,基于邻接矩阵进行节点之间的特征传递,学习邻居节点的特征,更新用户节点的嵌入表示;
75.s310,另外,获取用户在预设时间步长内各时间戳交互的机票项目,将对应的二部图结构进行拼接,构建预设时间步长内的元路径,将所述元路径与用户进行匹配;
76.s312,通过计算用户之间的元路径上节点的均方距离获取用户之间的相似度,将所述相似度作为注意力权重,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征;
77.s314,根据用户的搜索信息获取对应的机票运价数据,根据用户的偏好特征结合获取的下次更新时间及预测机票运价分析机票的运价变化趋势,并查询的信息与运价变化趋势返回至用户端。
78.需要说明的是,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征,所述用户偏好特征的具体公式为:户偏好特征,所述用户偏好特征的具体公式为:其中,fu表示用户u的偏好特征,σ表示非线性激活函数,ws表示共享结构矩阵,hv表示其他用户v节点的嵌入表示,α
uv
表示注意力权重,表示用户u的邻居节点集合。
79.当目标用户进行机票搜索过程中,根据目标用户搜索的时间戳获取与目标机票出发时间的时间差,获取目标机票的下次更新时间及预测机票运价,根据多个时间步的预测分析时间差内机票运价的运价变化趋势。
80.根据本发明实施例,根据用户的个人偏好特征构建个性化数据库,具体为:
81.获取目标用户在机票预订网站的交互行为构建个性化数据集,根据预设时间内的交互行为数据进行偏好分析,获取目标用户当前预设时间内的偏好特征;
82.当目标用户进行机票搜索过程中,根据所述偏好特征对目标用户进行机票推荐,
并根据目标用户的搜索行为对机票信息进行重点标注,对重点标注的机票进行监测;
83.在监测过程中,获取机票运价的更新周期及更新频率,判断价格趋势,基于目标用户偏好特征输出最佳购买时间;
84.实时获取目标用户的交互行为,对所述个性化数据库进行更新,并更新对应的偏好特征,当目标用户的交互行为对应的时间戳超过预设存储时间阈值,则将目标对象的个性化数据进行删除。
85.需要说明的是,用户偏好包括用户的偏好出发时间、提前预定时间、预定价格特征及出行地点特征等。
86.图4示出了本发明一种基于机器学习的航路机票运价数据处理系统的框图。
87.本发明第二方面还提供了一种基于机器学习的航路机票运价数据处理系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被所述处理器执行时实现如下步骤:
88.获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;
89.根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;
90.基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;
91.获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;
92.基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。
93.需要说明的是,提取历史机票运价数据中关键词信息,根据关键词信息确定起飞城市信息及目的城市信息,提取航线信息,基于所述航线信息设置分类标签;根据所述分类标签将历史机票运价数据进行分类,获取不同分类标签下的机票运价数据集,根据节假日信息及普通日信息将对应的机票运价数据进行标记;对不同标记下机票运价数据进行时序分析,获取机票运价的的变化时间戳及变化差价,生成各航线的时序变化序列,获取历史机票运价的更新周期及更新频次。
94.根据本发明实施例,通过机票运价数据更新模型获取机票运价数据的下次更新时间,具体为:
95.将多源机票运价数据进行筛选获取目标机票运价数据,提取目标机票运价数据的航线信息、时间信息及仓位信息,获取过去预设时间内的时序变化序列及访问量变化序列作为机票运价数据更新模型的输入;
96.在机票运价数据更新模型引入自注意力机制,构建自注意力层,将不同时间步长的隐藏层状态输出作为所述自注意力层的输入,计算自注意力权重;
97.通过所述自注意力权重表征各时间步长对预测目标的重要性,根据迭代计算后,输出目标机票运价数据的下次更新时间。
98.需要说明的是,通过所述自注意力权重表征各时间步长对预测目标的重要性,所述自注意力权重的计算公式为其中,表示在t时间步隐藏层状态的注意力得分,tanh表示激活函数,w
cvc
表示自注意力层参数,bc表示偏置,t表示矩阵转置。
99.基于大数据手段获取机票预订相关网站中各航线信息的查询量,根据航线信息的目的地信息设置异构信息检索标签,并根据各更新周期获取检索时间步长,获取异构信息的查询量,所述异构信息可以通过旅行服务提供商的酒店预定信息、旅游搜索信息等获取;设置转化系数与异构信息的查询量进行结合,将结合后的数据与各航线信息的查询量进行匹配,获取各更新周期内最终访问量,所述转化系数通过某一城市历史同期时段航空客流量与总客流量的比值进行设置;将最终访问量关联到时序变化序列,获取访问量与更新周期的关联特征,构建特征样本数据集。
100.基于粒子群算法优化后的lstm网络构建机票运价数据更新模型,根据lstm网络中隐藏层神经元个数、学习率及最大迭代次数设置粒子,并初始化粒子参数,包括粒子群算法的最大迭代次数、种群规模、加速系数及惯性权重等,并设置初始位置及速度;确定lstm网络的网络结构,根据实际值与预测值的均方误差设置适应度函数,根据不断更新粒子个体最优和全局最优进行粒子的位置寻优,当更替得到的最优位置则停止寻优过程,根据粒子的最优位置确定lstm网络的参数;将所述特征样本数据集按照预设比例划分为训练集与测试集,经过迭代训练后输出准确度符合预设标准的机票运价数据更新模型。
101.需要说明的是,根据各航线历史机票运价的时序变化序列及访问量变化序列通过数据挖掘获取机票运价的影响因素,所述数据挖掘能够利用大数据手段实现,通过文献及相关资料检索、专家经验汇总等方法获取机票运价的影响因素,一般包括航班自身因素、节假日因素、星期因素等,对所述影响因素通过随机森林或者主成分分析等方法进行筛选获取过去预设时间段内影响目标机票运价的影响因素集合;基于时间卷积神经网络构建机票运价预测网络,所述机票运价预测网络通过3个因果卷积汇成的扩张卷积网络残差快,与1个1
×
1卷积核的卷积网络组合而成,并最终通过1层全连接层输出最终的预测结果;
102.将获取的下次更新时间作为目标预测时间,将所述影响因素集合中影响因素与目标机票运价过去预设时间内的时序变化序列进行匹配,并进行归一化处理;将归一化后的数据导入机票运价预测网络,获取目标预测时间的预测机票运价,将下次更新时间及所述预测机票运价设置数据标签后进行存储。
103.根据本发明实施例,基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端,具体为:
104.获取用户的历史行为数据,根据所述历史行为数据获取预设时间步长内用户与机票项目节点的交互信息,通过所述交互信息生成用于与机票项目的二部图结构;
105.获取用户的基础信息、航段信息及提前购票时间信息,作为所述二部图结构中节点的附加特征;
106.基于图卷积神经网络对所述二部图结构进行学习表示,得到用户与机票项目的初始向量表示,将用户与机票项目的初始向量表示进行拼接,构建邻接矩阵;
107.通过图卷积神经网络的消息传递机制及邻居聚合机制,基于邻接矩阵进行节点之间的特征传递,学习邻居节点的特征,更新用户节点的嵌入表示;
108.另外,获取用户在预设时间步长内各时间戳交互的机票项目,将对应的二部图结构进行拼接,构建预设时间步长内的元路径,将所述元路径与用户进行匹配;
109.通过计算用户之间的元路径上节点的均方距离获取用户之间的相似度,将所述相似度作为注意力权重,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征;
110.根据用户的搜索信息获取对应的机票运价数据,根据用户的偏好特征结合获取的下次更新时间及预测机票运价分析机票的运价变化趋势,并查询的信息与运价变化趋势返回至用户端。
111.需要说明的是,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征,所述用户偏好特征的具体公式为:户偏好特征,所述用户偏好特征的具体公式为:其中,fu表示用户u的偏好特征,σ表示非线性激活函数,ws表示共享结构矩阵,hv表示其他用户v节点的嵌入表示,α
uv
表示注意力权重,表示用户u的邻居节点集合。
112.当目标用户进行机票搜索过程中,根据目标用户搜索的时间戳获取与目标机票出发时间的时间差,获取目标机票的下次更新时间及预测机票运价,根据多个时间步的预测分析时间差内机票运价的运价变化趋势。
113.本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被处理器执行时,实现如上述任一项所述的一种基于机器学习的航路机票运价数据处理方法的步骤。
114.在本技术所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
115.上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
116.另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
117.本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者
光盘等各种可以存储程序代码的介质。
118.或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。
119.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

技术特征:
1.一种基于机器学习的航路机票运价数据处理方法,其特征在于,包括以下步骤:获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。2.根据权利要求1所述的一种基于机器学习的航路机票运价数据处理方法,其特征在于,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列,具体为:提取历史机票运价数据中关键词信息,根据关键词信息确定起飞城市信息及目的城市信息,提取航线信息,基于所述航线信息设置分类标签;根据所述分类标签将历史机票运价数据进行分类,获取不同分类标签下的机票运价数据集,根据节假日信息及普通日信息将对应的机票运价数据进行标记;对不同标记下机票运价数据进行时序分析,获取机票运价的的变化时间戳及变化差价,生成各航线的时序变化序列,获取历史机票运价的更新周期及更新频次。3.根据权利要求1所述的一种基于机器学习的航路机票运价数据处理方法,其特征在于,基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型,具体为:基于大数据手段获取机票预订相关网站中各航线信息的查询量,根据航线信息的目的地信息设置异构信息检索标签,并根据各更新周期获取检索时间步长,获取异构信息的查询量;设置转化系数与异构信息的查询量进行结合,将结合后的数据与各航线信息的查询量进行匹配,获取各更新周期内最终访问量,关联到时序变化序列,获取访问量与更新周期的关联特征,构建特征样本数据集;基于粒子群算法优化后的lstm网络构建机票运价数据更新模型,根据lstm网络中隐藏层神经元个数、学习率及最大迭代次数设置粒子,并初始化粒子参数,并设置初始位置及速度;根据均方误差设置适应度函数,根据不断更新粒子个体最优和全局最优进行粒子的位置寻优,根据粒子的最优位置确定lstm网络的参数;将所述特征样本数据集按照预设比例划分为训练集与测试集,经过迭代训练后输出准确度符合预设标准的机票运价数据更新模型。4.根据权利要求1所述的一种基于机器学习的航路机票运价数据处理方法,其特征在于,通过机票运价数据更新模型获取机票运价数据的下次更新时间,具体为:
将多源机票运价数据进行筛选获取目标机票运价数据,提取目标机票运价数据的航线信息、时间信息及仓位信息,获取过去预设时间内的时序变化序列及访问量变化序列作为机票运价数据更新模型的输入;在机票运价数据更新模型引入自注意力机制,构建自注意力层,将不同时间步长的隐藏层状态输出作为所述自注意力层的输入,计算自注意力权重;通过所述自注意力权重表征各时间步长对预测目标的重要性,根据迭代计算后,输出目标机票运价数据的下次更新时间。5.根据权利要求1或4所述的一种基于机器学习的航路机票运价数据处理方法,其特征在于,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储,具体为:根据各航线历史机票运价的时序变化序列及访问量变化序列通过数据挖掘获取机票运价的影响因素,对所述影响因素进行筛选获取过去预设时间段内影响目标机票运价的影响因素集合;基于时间卷积神经网络构建机票运价预测网络,将获取的下次更新时间作为目标预测时间,将所述影响因素集合中影响因素与目标机票运价过去预设时间内的时序变化序列进行匹配,并进行归一化处理;将归一化后的数据导入机票运价预测网络,获取目标预测时间的预测机票运价,将下次更新时间及所述预测机票运价设置数据标签后进行存储。6.根据权利要求1所述的一种基于机器学习的航路机票运价数据处理方法,其特征在于,基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端,具体为:获取用户的历史行为数据,根据所述历史行为数据获取预设时间步长内用户与机票项目节点的交互信息,通过所述交互信息生成用于与机票项目的二部图结构;获取用户的基础信息、航段信息及提前购票时间信息,作为所述二部图结构中节点的附加特征;基于图卷积神经网络对所述二部图结构进行学习表示,得到用户与机票项目的初始向量表示,将用户与机票项目的初始向量表示进行拼接,构建邻接矩阵;通过图卷积神经网络的消息传递机制及邻居聚合机制,基于邻接矩阵进行节点之间的特征传递,学习邻居节点的特征,更新用户节点的嵌入表示;另外,获取用户在预设时间步长内各时间戳交互的机票项目,将对应的二部图结构进行拼接,构建预设时间步长内的元路径,将所述元路径与用户进行匹配;通过计算用户之间的元路径上节点的均方距离获取用户之间的相似度,将所述相似度作为注意力权重,利用图注意力结构对用户节点的嵌入表示进行聚合输出最终的用户偏好特征;根据用户的搜索信息获取对应的机票运价数据,根据用户的偏好特征结合获取的下次更新时间及预测机票运价分析机票的运价变化趋势,并查询的信息与运价变化趋势返回至用户端。7.一种基于机器学习的航路机票运价数据处理系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被所述处理器执行时实现如下步骤:
获取历史机票运价数据,按照航线信息将历史机票运价数据划分为不同数据集,对不同数据集进行时序分析,获取各航线机票运价的时序变化序列;根据所述时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将所述访问量与时序变化序列关联,获取特征样本数据集;基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型;获取多源机票运价数据,根据预设参数化基准对所述多源机票运价数据进行筛选,通过机票运价数据更新模型获取机票运价数据的下次更新时间,基于下次更新时间获取预测机票运价,设置数据标签进行数据存储;基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。8.根据权利要求7所述的一种基于机器学习的航路机票运价数据处理系统,其特征在于,基于机器学习构建机票运价数据更新模型,利用所述特征样本数据集进行训练,测试达标后输出训练后机票运价数据更新模型,具体为:基于大数据手段获取机票预订相关网站中各航线信息的查询量,根据航线信息的目的地信息设置异构信息检索标签,并根据各更新周期获取检索时间步长,获取异构信息的查询量;设置转化系数与异构信息的查询量进行结合,将结合后的数据与各航线信息的查询量进行匹配,获取各更新周期内最终访问量,关联到时序变化序列,获取访问量与更新周期的关联特征,构建特征样本数据集;基于粒子群算法优化后的lstm网络构建机票运价数据更新模型,根据lstm网络中隐藏层神经元个数、学习率及最大迭代次数设置粒子,并初始化粒子参数,并设置初始位置及速度;根据均方误差设置适应度函数,根据不断更新粒子个体最优和全局最优进行粒子的位置寻优,根据粒子的最优位置确定lstm网络的参数;将所述特征样本数据集按照预设比例划分为训练集与测试集,经过迭代训练后输出准确度符合预设标准的机票运价数据更新模型。9.根据权利要求7所述的一种基于机器学习的航路机票运价数据处理系统,其特征在于,通过机票运价数据更新模型获取机票运价数据的下次更新时间,具体为:将多源机票运价数据进行筛选获取目标机票运价数据,提取目标机票运价数据的航线信息、时间信息及仓位信息,获取过去预设时间内的时序变化序列及访问量变化序列作为机票运价数据更新模型的输入;在机票运价数据更新模型引入自注意力机制,构建自注意力层,将不同时间步长的隐藏层状态输出作为所述自注意力层的输入,计算自注意力权重;通过所述自注意力权重表征各时间步长对预测目标的重要性,根据迭代计算后,输出目标机票运价数据的下次更新时间。10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中包括一种基于机器学习的航路机票运价数据处理方法程序,所述一种基于机器学习的航路机票运价数据处理方法程序被处理器执行时,实现如权利要求1至6中任一项所述的一种基于机器学习的
航路机票运价数据处理方法步骤。

技术总结
本发明公开了一种基于机器学习的航路机票运价数据处理方法、系统及介质,包括:获取历史机票运价数据,提取各航线机票运价的时序变化序列;根据时序变化序列获取历史机票运价的更新周期及更新频次,另外基于大数据手段获取各航线的在各更新周期中的访问量,将访问量与时序变化序列关联;基于机器学习构建机票运价数据更新模型,获取多源机票运价数据,通过机票运价数据更新模型获取机票运价数据的下次更新时间及预测机票运价,并进行数据存储;基于用户搜索的时间戳调用存储数据中的机票运价数据,输出结果返回用户端。本发明通过机票运价数据进行数据处理机,获取合理的价格预测,并提高用户购买旅游产品过程中的价格准确性和成功率。性和成功率。性和成功率。


技术研发人员:詹谊 王峻泉 周南珊
受保护的技术使用者:深圳航路旅行科技有限公司
技术研发日:2023.05.04
技术公布日:2023/8/1
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐