业务量预测方法及装置与流程
未命名
08-03
阅读:76
评论:0

1.本发明涉及核心网技术领域,特别是指一种业务量预测方法及装置。
背景技术:
2.当前,我国5g(第五代移动通信技术)产业商用化进程正在加速推进,来自各行各业不同领域的移动智能通信设备数量将呈现爆炸式增长。为了满足激增的数据流量以及数据密集型服务需求,5g网络建设部署即将迎来大规模发展期。而5g网络的建设部署则需依赖于国内运营商拟定的5g网络业务模型。通过建立行之有效的业务模型,统计并预测业务量的现状和未来发展方向,进而为后期网络建设提供更好的容量规划以及延展性。而业务模型的制定需要依赖于5g sa(独立组网)各网元侧各项性能指标容量的统计结果。故而,随着5g网络建设部署节奏的加快,关于5g网络业务量预测方法的研究也成为了当下重中之重的研究课题。
3.现有的5g网络业务,属于单一业务模型,主要基于国内运营商经验并结合实验室数据来确定业务模型的关键参数,其中参数包括:附着激活比、寻呼次数、ausf(认证服务器功能)鉴权次数等。通过上述方法得到的理论业务模型是静态不可变的。除此之外,业务模型的制定则需依赖于5g sa各网元侧业务量的统计结果。由于缺乏符合各地市网络特征的业务分析与预测手段,理论业务模型与实际网络存在偏离,从而导致5g网络容量规划与实际业务发展不匹配,规划设备不能满足亦或远大于用户实际业务需求,以造成网络负载过大亦或资源利用率过低的情况。
技术实现要素:
4.本发明要解决的技术问题是提供一种业务量预测方法及装置,能够精确预测业务量,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。
5.为解决上述技术问题,本发明的实施例提供技术方案如下:
6.一方面,提供一种业务量预测方法,包括:
7.获取源数据,所述源数据选自采集的独立组网网元的性能数据;
8.对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;
9.将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;
10.根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
11.一些实施例中,对所述源数据进行一阶滞后滤波包括:
12.对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波
输出值。
13.一些实施例中,将所述源数据输入lstm神经网络模型中之前,所述方法还包括:
14.对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
15.一些实施例中,所述lstm神经网络模型的激活函数使用elu函数;和/或
16.所述lstm神经网络模型采用均方误差的计算方式;和/或
17.所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或
18.所述lstm神经网络模型使用keras中的sequential模型。
19.一些实施例中,根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果包括:
20.计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;
21.计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;
22.根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
23.其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
24.所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0025]
一些实施例中,获取源数据包括:
[0026]
按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;
[0027]
丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;
[0028]
利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0029]
本发明实施例还提供了一种业务量预测装置,包括:
[0030]
获取模块,用于获取源数据,所述源数据选自采集的独立组网网元的性能数据;
[0031]
第一预测模块,用于对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;
[0032]
第二预测模块,用于将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;
[0033]
处理模块,用于根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
[0034]
一些实施例中,所述第一预测模块具体用于对所述源数据进行一阶滞后滤波,得
到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。
[0035]
一些实施例中,所述装置还包括:
[0036]
归一化模块,用于对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0037]
一些实施例中,所述lstm神经网络模型的激活函数使用elu函数;和/或
[0038]
所述lstm神经网络模型采用均方误差的计算方式;和/或
[0039]
所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或
[0040]
所述lstm神经网络模型使用keras中的sequential模型。
[0041]
一些实施例中,所述处理模块具体用于计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
[0042]
其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
[0043]
所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0044]
一些实施例中,所述获取模块具体用于按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0045]
本发明实施例还提供了一种业务量预测装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述处理器执行所述程序时实现如上所述的业务量预测方法。
[0046]
一些实施例中,所述处理器用于获取源数据,所述源数据选自采集的独立组网网元的性能数据;对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
[0047]
一些实施例中,所述处理器用于对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。
[0048]
一些实施例中,所述处理器用于对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0049]
一些实施例中,所述lstm神经网络模型的激活函数使用elu函数;和/或
[0050]
所述lstm神经网络模型采用均方误差的计算方式;和/或
[0051]
所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或
[0052]
所述lstm神经网络模型使用keras中的sequential模型。
[0053]
一些实施例中,所述处理器用于计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
[0054]
其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
[0055]
所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0056]
一些实施例中,所述处理器用于按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0057]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的业务量预测方法中的步骤。
[0058]
本发明的实施例具有以下有益效果:
[0059]
上述方案中,利用改进的s-arima模型和lstm神经网络模型联合进行业务量预测,能够高精度的预测业务量的现状和未来发展方向,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。
附图说明
[0060]
图1和图2为本发明实施例业务量预测方法的流程示意图;
[0061]
图3和图4为本发明实施例业务量预测装置的结构示意图;
[0062]
图5为本发明实施例业务量预测装置的组成示意图。
具体实施方式
[0063]
为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0064]
当前工程建设和基于此开展的性能测试,均采用单一的业务模型,单一业务模型便于工程评估,但由于实际网络会受到包括地区经济发展差异、用户人口结构差异、定制功
能要求差异、组网差异、套餐资费差异等影响因子的影响,单一业务模型与实际网络存在一定偏离,单一业务模型难以覆盖实际现网多样性差异化场景。
[0065]
5g网络建设部署即将迎来大规模发展期。5g引入后对用户信令层面和业务层面主要有两大影响。一方面,个人用户早已趋于饱和,未来5g用户普遍是以当前lte(长期演进)用户升级而来,因此目前lte用户的实际业务状态与未来5g nr(新空口)系统中的业务存在一定的关联性和趋势性;另一方面,5g业务相较4g来说也存在较大的变化,由于5g提供大带宽业务,典型应用带宽约为4g的3~4倍,高带宽是影响用户面业务体验的主要原因。核心网中信令的产生,主要成因在于用户行为、终端行为、网络规划组织以及签约业务等,5g当前个人用户从应用场景、终端行为相比4g都有较强的继承性,由于个人用户行为在一段时间内是存在规律性和延续性的,故可认为核心网中的信令也是存在同样的规律性和延续性,该特性也是做业务预测的前提。
[0066]
由于业务模型的制定需要依赖于5g sa各网元侧各项性能指标的统计结果,因此,本实施例提供一种基于优化后的s-arima(季节性差分自回归滑动平均)模型和lstm(长短期记忆)神经网络的5g网络业务量预测装置和方法。在本技术实施例中,网络业务量指的是各网元侧各项性能指标的统计容量,例如amf(认证管理功能)网元侧的amf_attinitreg(初始注册)、amf_pagatt(寻呼)指标值;smf(会话管理功能)网元侧的smf_attsmfmodifypdusession(pdu会话修改)、smf_attcreatepdusession(pdu会话建立)指标值等。通过建立与业务模型相关的5g sa各网元性能指标的高精度预测模型,统计并预测业务量的现状和未来发展方向,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。
[0067]
本发明实施例提供一种业务量预测方法及装置,能够精确预测业务量,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。
[0068]
本发明实施例提供一种业务量预测方法,如图1所示,包括:
[0069]
步骤101:获取源数据,所述源数据选自采集的独立组网网元的性能数据;
[0070]
步骤102:对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;
[0071]
步骤103:将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;
[0072]
步骤104:根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
[0073]
本实施例中,利用改进的s-arima模型和lstm神经网络模型联合进行业务量预测,能够高精度的预测业务量的现状和未来发展方向,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。
[0074]
一些实施例中,对所述源数据进行一阶滞后滤波包括:
[0075]
对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。
[0076]
一些实施例中,将所述源数据输入lstm神经网络模型中之前,所述方法还包括:
[0077]
对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0078]
一些实施例中,根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果包括:
[0079]
计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;
[0080]
计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;
[0081]
根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
[0082]
其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
[0083]
所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0084]
一些实施例中,获取源数据包括:
[0085]
按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;
[0086]
丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;
[0087]
利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0088]
由于个人用户行为在一段时间内是存在规律性和延续性的,故可认为核心网中的信令也是存在同样的规律性和延续性,该特性也是做模型预测的前提。
[0089]
由于用户行为规律性、延续性、以及用户人群的可聚类特性使得可以通过基于不同用户行为的历史数据分析迭加从而对网络中的业务进行一定周期的预测。而该类数据具有时间相关性,故本技术联合考虑了传统时间序列预测模型与深度学习网络模型进行趋势预测,提出了一种基于s-arima模型和lstm神经网络的5g网络业务量预测方法。
[0090]
如图2所示,本技术实施例将一定时间粒度的网元性能指标统计数值同时输入到s-arima模型以及lstm神经网络模型中,两模型同时进行模型训练预测,将预测结果进行比较,从而选定适用的业务模型,从而输出预测结果。本技术实施例对s-arima模型进行了优化,即在源数据输入模型前,先对源数据进行一阶滞后滤波,将滤波之后的数据作为数据源进行数据输入s-arima模型中,即改进后的arima乘积季节模型等价于一阶滞后滤波算法+s-arima模型。
[0091]
基于改进的arima乘积季节模型预测方法如下:
[0092]
(1)对源数据一阶滞后滤波,滤波结果y(n)=αx(n)+(1-α)y(n-1),α=滤波系数,α取值在0~1之间,当α取值越大,则表示本次采样值的权重越大,本技术实施例中选定α=
0.8;x(n)=本次采样值,为对应时间点某一指标取值;y(n-1)=上次滤波输出值为前一天同时间点该指标取值;y(n)=本次滤波输出值。例如,以一天的数据为一个周期,对于15分钟粒度的数据来说,数据周期为96,故而存在y(n)=x(n),n∈[1,96],y(n+96)=αx(n)+(1-α)x(n+96),n∈[1,n-96]。n为对应指标的上报次数,为正整数。
[0093]
在数据进行一阶滤波后,可以较为有效的抑制周期性和随机性的干扰,用平均结果作为更新后的时间序列,对周期性干扰具有良好的抑制作用。
[0094]
(2)观察滤波后的时间序列,如若该指标时间序列具有明显的周期性,且长期来看具有上涨趋势,则可判定为非平稳季节性时间序列,对于非平稳季节性时间序列,进行有限次的季节差分和非季节差分,可以转换为一个平稳的序列。
[0095]
(a)首先对原始数据进行单位根检验,经检验,若p值大于0.05,则证明该序列为非平稳的,亦或绘制非平稳季节性时间序列自相关和偏相关图,可知自相关图是周期震荡,故可再次印证该指标序列为非平稳季节性时间序列。
[0096]
(b)对原始数据进行1阶差分提取趋势信息,若数据时间粒度为15分钟,则利用96步差分提取周期信息,若时间粒度为60分钟,则需利用24步差分提取周期信息,1阶差分能够消除序列的趋势性,但序列的周期性较为明显,经过96步或24步差分后,序列的周期性可消除。可通过序列的自相关图和偏自相关图判断可得时间序列是否已平稳。同时,对差分后的数据进行单位根检验,经检验,p值若小于0.05,且检验统计量的值在90%、95%和99%的置信度下,检验统计量的值均小于对应的临界值。所以,有充分的证据可以拒绝原假设,认为1阶96步或24步差分后的序列是平稳的。说明差分后的数据是平稳的。
[0097]
(c)对差分之后的数据进行白噪声检验,经检验,p值小于0.01,则说明差分后的数据不是白噪声序列,说明差分后的序列可以进行下一步的建模分析。
[0098]
(3)模型定阶,本技术实施例考虑网格搜索的方法系统性的选择最优的参数值,选取依据为aic最小准则,aic准则是拟合精度和参数个数的加权函数,使aic函数达到最小的模型被认为是最优模型。最终确定arima(p,d,q)*(p,d,q)s,s根据数据粒度取s值为24/96的乘积季节模型。
[0099]
(4)模型检测:在拟合s-arima模型时,需要对模型进行诊断,通过模型诊断以确保模型所做任何假设都符合要求。模型检验中主要关心的问题是模型的残差是否相关的,并且是否是零均值的正态分布。如果s-arima模型残差是相关的,且不是零均值正态分布,则表明模型可以进一步改进,反之,模型拟合效果很好,可以认为模型充分提取了序列的信息。诊断中,需从自相关图,q-q图诊断残差序列是否是白噪声,如若证明残差序列为白噪声,则可进一步对模型进行预测。
[0100]
(5)模型预测,将p、d、q、p、d、q,s进行设置,随后进行预测,输出某指标预测结果值。
[0101]
基于lstm模型预测方法如下:
[0102]
本技术实施例使用keras框架来构建lstm模型,该模型对应预测方法流程如下:
[0103]
(1)对数据源进行归一化、训练集和测试数据集划分。
[0104]
(2)网络训练过程中涉及到的参数设置为:
[0105]
(a)确定lstm模块的激活函数,本技术实施例使用elu函数来作为各指标训练所用的激活函数。
[0106]
(b)确定误差的计算方式,本技术实施例使用均方误差(mean squared error,mse)作为误差的计算方式,选择该方式,可使得平均绝对百分比误差(mean absolute percentage error,mape)最小。
[0107]
(c)确定权重参数的迭代更新方式,本技术实施例使用rmsprop算法来作为权重参数的迭代更新方式,且学习率lr设置为0.001。
[0108]
(d)确定epoch和batch size,本技术实施例使用的数据训练迭代轮数(epochs)为50次,因为迭代轮数为50次时,该模型的loss函数可收敛至最小值;由于1天为一个数据周期,故而如若使用15分钟粒度的数据,则96(24*60/15)个数据为一个数据周期,如若使用60分钟粒度的数据,则24(24*60/24)个数据为一个数据周期,在本技术实施例中设置batch size=96*2(数据粒度对应为15分钟),即每经过192个样本点更新一次权重,同样地,当数据粒度为60分钟时,batch size=24*2;verbose=2,设置为每个epoch输出一行记录。
[0109]
(e)确定lstm模型网络结构,本技术实施例使用keras中的sequential模型(序贯模型),一层包含8个神经元:model.add(lstm(8,input_shape=(none,1))),使用dense全连接层:model.add(dense(1))
[0110]
(3)确定lstm模型中的参数设置后,用训练数据输入到该模型中,进行训练,并使用测试数据集进行预测,并对预测数据结果进行反归一化处理。
[0111]
将数据源同时输入到优化后的s-arima模型与lstm模型中,通过对应指标来比较衡量上述两个模型的优劣,选择预测准确度较高、模型拟合程度较好的模型,并进行预测结果输出。
[0112]
上述两个模型中,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0113]
本技术实施例使用平均绝对百分比误差mape、决定系数r2来衡量模型的优劣。mape:用来衡量评估预测值的准确程度,mape是相对值,不是绝对值,mape越小,说明模型预测准确度越高。时间序列真实值集合为{y1,y2,y3,
…
,yn},对应真实值的每个预测值集合为故mape定义为集合内(真实值-预测值)/真实值取绝对值后的均值,即
[0114]
的均值。
[0115]
r2用来衡量模型的拟合程度(模型质量好坏),它是将预测值跟只使用均值的情况下相比,其区间在(0,1)之间,0表示不如什么都不预测,直接取均值的情况,而1表示所有预测跟真实结果完美匹配的情况,故而,r2越大,模型拟合度越好,模型质量越好。由于r2是一个无量纲的指标,这给解决不同度量的问题带来了很大方便。为时间序列真实值集合的平均值,对应地,r2定义为1与(n个预测值与真实值差值平方之和除以n个真实值与真实值均值的差值平方之和)的差值,对应表达式为
[0116]
[0117]
本技术实施例认为当r2》0.8,mape《10%时,该预测模型质量较高,可利用该模型进行具体应用场景和具体数据集的后续预测。
[0118]
本技术实施例对s-arima模型进行了优化改进,即源数据先进行一阶滞后滤波优化,再对s-arima模型进行定阶,通过现网amf网元60分钟粒度amf_attservicereq&amf_pagatt数据,得到该模型为s-arima(0,1,1),(0,1,1)24。下表1所示为amf_attservicereq&amf_pagatt预测结果。由表1可知,amf_attservicereq、amf_pagatt预测结果的平均百分误差均在10%以内,属于高精度预测。本技术方案所提优化后的s-arima模型mape误差值相较原s-arima模型较小,说明使用一阶滞后滤波重构的预测模型精度比普通的模型更优,可作为后续网元指标的预测模型。
[0119]
表1 amf_attservicereq&amf_pagatt预测结果
[0120][0121][0122]
下表2所示为15分钟粒度优化后的s-arima与lstm模型各指标预测结果对比。由下表2结果可知,优化后的s-arima模型与lstm模型下amf_authreq、amf_regupdreq、amf_att5ghandoverto4g各指标的mape值均在10%以内,拟合度r2取值均大于80%,两个模型均可以做到高精度预测,从而也证明了两个模型在预测5g网络业务指标的可行性。
[0123]
表2 15min粒度优化后的s-arima与lstm模型各指标评估对比
[0124]
[0125]
本发明实施例还提供了一种业务量预测装置,如图3所示,包括:
[0126]
获取模块11,用于获取源数据,所述源数据选自采集的独立组网网元的性能数据;
[0127]
第一预测模块12,用于对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;
[0128]
第二预测模块13,用于将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;
[0129]
处理模块14,用于根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
[0130]
一些实施例中,所述第一预测模块具体用于对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。
[0131]
一些实施例中,所述装置还包括:
[0132]
归一化模块,用于对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0133]
一些实施例中,所述lstm神经网络模型的激活函数使用elu函数;和/或
[0134]
所述lstm神经网络模型采用均方误差的计算方式;和/或
[0135]
所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或
[0136]
所述lstm神经网络模型使用keras中的sequential模型。
[0137]
一些实施例中,所述处理模块具体用于计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
[0138]
其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
[0139]
所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0140]
一些实施例中,所述获取模块具体用于按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0141]
另外,如图4所示,本技术实施例的网络业务量预测装置还包括:数据采集模块、数据处理模块、预测模块,线性非线性分类模块、拟合模块、阈值比较模块、弹缩模块。
[0142]
其中,数据采集模块负责采集以月为周期从北向网管上采集5g sa网元(包含amf
(接入和移动性管理功能)、smf(业务管理功能)、pcf(策略控制功能)、udm(统一数据管理功能)、nrf(网络开放功能)、upf(用户面功能)、chf(新计费功能))以15分钟为粒度的连续性能统计指标,具体数据包含:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标采集。
[0143]
数据处理模块包含:数据异常识别单元、数据丢弃单元、数据异常处理单元,数据处理生成单元。
[0144]
其中,数据异常识别单元主要负责两类上报异常数据的识别,一类异常数据为网元上报缺失数据,该类数据产生的原因为原始数据中某些虚池中网元未上报信息,即存在15分钟粒度网元数据漏取现象;一类异常数据为网元上报异常,即网元某指标在某一时间点上报异常,上报异常界定为:大于该网元指标取值均值的n倍(本技术实施例中n取值为10),小于该网元指标取值均值的1/n倍,这区间为上报异常数据。
[0145]
数据丢弃单元主要负责丢弃两类数据,一类为某一资源池所属网元上报缺失较多的数据。即数据异常识别单元中会计算一个周期每个网元应该上报数据的次数,当识别到某一网元实际上报数据的次数小于应上报次数的1/m(本技术实施例中m取值为3)倍,则丢弃该网元上报数据;一类为资源池所属网元属于备用池的数据,通过分析,可知资源池所属网元分为主用池和备用池,由于备用池上报指标数据值极小,故本文认为若上报数据属于备用池,则丢弃该数据所属网元。
[0146]
数据异常处理单元负责处理数据异常识别单元主中识别并经数据丢弃单元丢弃之后剩余的两类上报异常数据。对于网元上报缺失的异常数据首先按时间顺序将缺失的数据填充为0,此时该类异常数据变为填充数据异常。再将填充数据异常、网元上报异常两类异常合并进行处理,处理过程为某一时间点对应指标异常值重新赋值为前两天同一时间点取值的均值。
[0147]
数据处理生成单元负责生成不同省份维度、不同资源池维度、不同时间粒度维度的数据。其中,时间维度可分为15分钟,60分钟,1天。
[0148]
预测模块:将经数据处理模块处理之后数据作为数据源,进行5g网络业务指标趋势预测。
[0149]
线性非线性分类模块:将某一网元的每一个指标与资源负荷(cpu、存储)进行拟合,映射,根据拟合关系式分类,分为线性拟合指标类别,非线性拟合指标类别。
[0150]
拟合模块:将线性拟合指标类别与非线性拟合指标类别的指标叠加考虑,拟合得出各指标与资源负荷之间的关系式。利用最小二乘法将联合考虑构建多元线性、非线性指标与资源负荷的关系式,且多元线性所占权重与多元非线性所占权重之和为1,即该拟合模块也可以通过上述拟合关系式得出经预测模块预测之后的各网元性能指标值对资源负荷的定量影响值。
[0151]
阈值比较模块:当资源负荷超过某一阈值时,即表示对应网元或系统负载业务压力较大,触发报警,当资源负荷小于某一阈值时,对应表示对应网元或系统处于轻负载。
[0152]
弹缩模块:由于大话务背景下会触发报警,系统负载业务较大时,自动弹出业务虚机,用于分担原有业务虚机的业务压力;相反地,当系统处于业务轻载情况下时,即资源负荷小于一定门限值时,触发业务虚机自动启动业务缩容。
[0153]
本发明实施例还提供了一种业务量预测装置,如图5所示,包括存储器21、处理器22及存储在所述存储器21上并可在所述处理器22上运行的计算机程序;所述处理器22执行所述程序时实现如上所述的业务量预测方法。
[0154]
一些实施例中,所述处理器22用于获取源数据,所述源数据选自采集的独立组网网元的性能数据;对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。
[0155]
一些实施例中,所述处理器22用于对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。
[0156]
一些实施例中,所述处理器22用于对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。
[0157]
一些实施例中,所述lstm神经网络模型的激活函数使用elu函数;和/或
[0158]
所述lstm神经网络模型采用均方误差的计算方式;和/或
[0159]
所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或
[0160]
所述lstm神经网络模型使用keras中的sequential模型。
[0161]
一些实施例中,所述处理器22用于计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;
[0162]
其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;
[0163]
所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。
[0164]
一些实施例中,所述处理器22用于按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。
[0165]
本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的业务量预测方法中的步骤。
[0166]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动
态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储待检测终端设备或任何其他非传输介质,可用于存储可以被计算待检测终端设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0167]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
技术特征:
1.一种业务量预测方法,其特征在于,包括:获取源数据,所述源数据选自采集的独立组网网元的性能数据;对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。2.根据权利要求1所述的业务量预测方法,其特征在于,对所述源数据进行一阶滞后滤波包括:对所述源数据进行一阶滞后滤波,得到滤波结果y(n)=αx(n)+(1-α)y(n-1),其中,α为滤波系数,α取值在0~1之间,x(n)为本次采样值,对应第一时间点的预设指标的取值,y(n-1)为上次滤波输出值,为前一天第一时间点所述预设指标的取值,y(n)为本次滤波输出值。3.根据权利要求1所述的业务量预测方法,其特征在于,将所述源数据输入lstm神经网络模型中之前,所述方法还包括:对所述源数据进行归一化,将归一化后的源数据划分为训练数据和测试数据,所述训练数据在整个时间序列数据中的占比为80%,所述测试数据在整个时间序列数据中的占比为20%。4.根据权利要求1所述的业务量预测方法,其特征在于,所述lstm神经网络模型的激活函数使用elu函数;和/或所述lstm神经网络模型采用均方误差的计算方式;和/或所述lstm神经网络模型的权重参数使用rmsprop算法进行迭代更新;和/或所述lstm神经网络模型使用keras中的sequential模型。5.根据权利要求1所述的业务量预测方法,其特征在于,根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果包括:计算所述第一业务量预测结果的第一平均绝对百分比误差mape,计算所述第二业务量预测结果的第二mape;计算所述第一业务量预测结果的第一决定系数,计算所述第二业务量预测结果的第二决定系数;根据所述第一mape、第二mape、第一决定系数和第二决定系数选取预测模型,所述预测模型选自lstm神经网络模型和s-arima模型,并利用所述预测模型进行预测,得到所述最终的业务量预测结果;其中,所述预测模型的业务量预测结果满足mape小于0.1,决定系数大于0.8;所述mape为数据集合内[(真实值-预测值)/真实值]取绝对值后的均值,所述决定系数为1与a的差值,a为n个预测值与真实值的差值的平方之和,除以n个真实值与真实值均值的差值的平方之和。6.根据权利要求1所述的业务量预测方法,其特征在于,获取源数据包括:按照预设周期从独立组网网元中以预设粒度采集性能数据,所述性能数据包括以下至少一项:时间戳,所属虚拟池信息,所属网元信息,网络规划类数据、网络统计类数据、信令统计类数据、典型网元连续资源利用指标;
丢弃所采集数据中的异常数据,所述异常数据包括网元上报缺失数据、网元上报异常数据以及资源池所属网元属于备用池的数据;利用剩余的数据生成不同省份维度、不同资源池维度、不同时间粒度维度的源数据。7.一种业务量预测装置,其特征在于,包括:获取模块,用于获取源数据,所述源数据选自采集的独立组网网元的性能数据;第一预测模块,用于对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入s-arima模型中,得到第一业务量预测结果;第二预测模块,用于将所述源数据输入lstm神经网络模型中,得到第二业务量预测结果;处理模块,用于根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。8.一种业务量预测装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的业务量预测方法。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的业务量预测方法中的步骤。
技术总结
本发明提供了一种业务量预测方法及装置,属于核心网技术领域。业务量预测方法,包括:获取源数据,所述源数据选自采集的独立组网网元的性能数据;对所述源数据进行一阶滞后滤波,将滤波之后的数据作为数据源输入S-ARIMA模型中,得到第一业务量预测结果;将所述源数据输入LSTM神经网络模型中,得到第二业务量预测结果;根据所述第一业务量预测结果和所述第二业务量预测结果确定最终的业务量预测结果。本发明的技术方案能够精确预测业务量,为后期的现网建设提供较好的容量规划建议,以减少规划设备与实际用户需求偏离过大等问题的发生。备与实际用户需求偏离过大等问题的发生。备与实际用户需求偏离过大等问题的发生。
技术研发人员:冯楠 刘贺林 周泉 钟大平
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2022.01.18
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:牙科椅装置的制作方法 下一篇:一种基于联邦学习的动态聚合方法和装置与流程