信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其可读存储介质与流程

未命名 08-29 阅读:111 评论:0


1.本发明涉及计算机软件领域,尤其涉及网络请求数据识别领域,具体是指一种信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质。


背景技术:

2.网络请求数据是指在计算机网络中,一台计算机向另一台计算机请求数据的过程。这通常通过使用协议,如http,ftp,smtp等来实现。网络请求数据可以是一个文件、一张图片、一个网页、一个视频、或者其他形式的数字内容。在现代社会,网络请求数据在许多方面都是至关重要的,因为它允许用户获取全球信息,连接到互联网,进行网上购物,参与社交网络等。常规的识别网络请求数据的方法包括:检查http请求方法,http请求方法是指请求的类型,常见的请求方法包括get、post、put、delete等。每种请求方法都有不同的用途;检查请求的header,请求的header是指请求的附加信息,包括内容类型、接受的数据格式等。根据请求的header内容可以识别请求的类型;检查请求的payload,请求的payload是指请求的数据内容,在请求的payload中可以识别请求的数据类型,例如文本、图像等;使用网络分析工具,使用网络分析工具,如wireshark,可以详细分析请求的内容,识别请求的类型。然而,传统的方法对网络请求数据的识别精度不高,同时识别效率低,因此有必要采用人工智能的方法进行网络请求数据的高效识别。
3.现有技术创新性好,但模型的分类精度有待进一步提升,且模型的鲁棒性和泛化能力较差。此外,现有方法容易受训练样本的数量和质量的影响。


技术实现要素:

4.本发明的目的是克服了上述现有技术的缺点,提供了一种满足鲁棒性高、泛化能力高、分类精度高的信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质。
5.为了实现上述目的,本发明的信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质如下:
6.该信创环境下基于人工智能实现网络请求数据分类的方法,其主要特点是,所述的方法包括以下步骤:
7.(1)获取网络请求数据;
8.(2)把数据转换为机器能够识别的向量样本;
9.(3)对数据进行批归一化处理操作;
10.(4)对数据进行混类增强操作;
11.(5)对网络请求数据进行特征提取操作;
12.(6)利用softmax分类器进行分类。
13.较佳地,所述的步骤(1)具体包括以下步骤:
14.(1.1)获取网络请求数据;
15.(1.2)进行人工进行标注,通过利用带标签的数据进行人工智能模型的训练。
16.较佳地,所述的步骤(2)具体包括以下步骤:
17.(2.1)建立word2vec模型;
18.(2.2)通过word2vec模型训练数据得到向量样本。
19.较佳地,所述的步骤(3)中进行批归一化处理,具体为:
20.根据以下公式进行批归一化处理:
[0021][0022]
其中,z(i)为原激活值,为经过批归一化变化之后的激活值,γ和β的取值是反向传播的过程中模型学习的参数。
[0023]
较佳地,所述的步骤(5)具体包括以下步骤:
[0024]
(5.1)通过连续3层卷积的第1层卷积提取低级的特征,通过第2层和第3层卷积利用低级的特征进行迭代提取;
[0025]
(5.2)在卷积层后设置注意力模块,通过注意力层计算多个向量或向量组的加权平均;
[0026]
(5.3)在注意力模块后增加池化层,通过池化层进行池化计算。
[0027]
较佳地,所述的步骤(6)具体包括以下步骤:
[0028]
通过softmax分类器进行归一化处理后,得到预测的网络请求数据所属的类别概率,计算损失函数l
xent

[0029]
较佳地,所述的步骤(6)中计算损失函数l
xent
,具体为:
[0030]
根据以下公式计算损失函数l
xent

[0031][0032]
其中,yi为网络请求数据真实类别的one-hot表示,pi为网络请求数据所属类别概率,c为类别数。
[0033]
该用于实现信创环境下基于人工智能的网络请求数据分类的装置,其主要特点是,所述的装置包括:
[0034]
处理器,被配置成执行计算机可执行指令;
[0035]
存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0036]
该用于实现信创环境下基于人工智能的网络请求数据分类的处理器,其主要特点是,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0037]
该计算机可读存储介质,其主要特点是,其上存储有计算机程序,所述的计算机程
序可被处理器执行以实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0038]
采用了本发明的信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质,具有较高的分类精度,且所提出的模型具有较高的鲁棒性和泛化能力。此外,本发明能够有效避免训练样本不足给模型性能造成负面影响的情况。
附图说明
[0039]
图1为本发明的信创环境下基于人工智能实现网络请求数据分类的方法的流程图。
具体实施方式
[0040]
为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。
[0041]
本发明的该信创环境下基于人工智能实现网络请求数据分类的方法,其中包括以下步骤:
[0042]
(1)获取网络请求数据;
[0043]
(2)把数据转换为机器能够识别的向量样本;
[0044]
(3)对数据进行批归一化处理操作;
[0045]
(4)对数据进行混类增强操作;
[0046]
(5)对网络请求数据进行特征提取操作;
[0047]
(6)利用softmax分类器进行分类。
[0048]
作为本发明的优选实施方式,所述的步骤(1)具体包括以下步骤:
[0049]
(1.1)获取网络请求数据;
[0050]
(1.2)进行人工进行标注,通过利用带标签的数据进行人工智能模型的训练。
[0051]
作为本发明的优选实施方式,所述的步骤(2)具体包括以下步骤:
[0052]
(2.1)建立word2vec模型;
[0053]
(2.2)通过word2vec模型训练数据得到向量样本。
[0054]
作为本发明的优选实施方式,所述的步骤(3)中进行批归一化处理,具体为:
[0055]
根据以下公式进行批归一化处理:
[0056][0057]
其中,z(i)为原激活值,为经过批归一化变化之后的激活值,γ和β的取值是反向传播的过程中模型学习的参数。
[0058]
作为本发明的优选实施方式,所述的步骤(5)具体包括以下步骤:
[0059]
(5.1)通过连续3层卷积的第1层卷积提取低级的特征,通过第2层和第3层卷积利用低级的特征进行迭代提取;
[0060]
(5.2)在卷积层后设置注意力模块,通过注意力层计算多个向量或向量组的加权平均;
[0061]
(5.3)在注意力模块后增加池化层,通过池化层进行池化计算。
[0062]
作为本发明的优选实施方式,所述的步骤(6)具体包括以下步骤:
[0063]
通过softmax分类器进行归一化处理后,得到预测的网络请求数据所属的类别概率,计算损失函数l
xent

[0064]
作为本发明的优选实施方式,所述的步骤(6)中计算损失函数l
xent
,具体为:
[0065]
根据以下公式计算损失函数l
xent

[0066][0067]
其中,yi为网络请求数据真实类别的one-hot表示,pi为网络请求数据所属类别概率,c为类别数。
[0068]
本发明的该用于实现信创环境下基于人工智能的网络请求数据分类的装置,其中所述的装置包括:
[0069]
处理器,被配置成执行计算机可执行指令;
[0070]
存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0071]
本发明的该用于实现信创环境下基于人工智能的网络请求数据分类的处理器,其中所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0072]
本发明的该计算机可读存储介质,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现上述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。
[0073]
网络请求数据在许多方面都是至关重要的,因为它允许用户获取全球信息,连接到互联网,进行网上购物,参与社交网络等。本发明的具体实施方式中,提出一种信创环境下基于人工智能的网络请求数据分类方法,首先,获取网络请求数据,并人工进行标注,以利用带标签的数据进行人工智能模型的训练。其次,把数据转换为机器能够识别的向量样本。再次,对数据进行批归一化处理操作。最后,对数据进行混类增强操作。
[0074]
本发明提出一种独立于数据集的数据扩增方式,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本。然后对网络请求数据进行特征提取操作,采用多尺寸卷积神经网络进行特征提取,并提出一种注意力模块进行注意力增强操作。最后,利用softmax分类器进行分类。
[0075]
本发明提出一种信创环境下基于人工智能的网络请求数据分类方法,主要步骤如下:
[0076]
步骤一:网络请求数据获取
[0077]
首先,获取网络请求数据,获取的来源包括:
[0078]
http请求:通过使用http客户端库(如requests库)发送http请求,然后从响应中获取数据。
[0079]
webapi:通过向webapi发送http请求,获取json或xml格式的数据。
[0080]
socket编程:通过创建和连接套接字,从网络上接收数据。
[0081]
网络请求数据获取后,需人工进行标注,以利用带标签的数据进行人工智能模型的训练。
[0082]
步骤二:把数据转换为机器能够识别的向量样本
[0083]
本发明采用word2vec方法,进行向量转化。word2vec是一种现有的将文本数据转为向量的方法,word2vec模型实际上分为了两个部分,第一部分为建立模型,第二部分是通过模型获取嵌入词向量。word2vec的整个建模过程实际上与自编码器的思想很相似,即先基于训练数据构建一个神经网络,当这个模型训练好以后,并不会用这个训练好的模型处理新的任务,而是这个模型通过训练数据所学得的参数。
[0084]
步骤三:对数据进行批归一化
[0085]
在每次训练中,一个批次中所有激活值的方差用σ2表示,μ表示一个批次中所有激活值的平均值,用ε为了防止σ2的取值为0时出现的异常,ε的取值大于0。原激活值用z(i)表示,经过批归一化变化之后的激活值用表示,下式表示传统的标准化的流程,方式是通过让所有激活函数的方差为1,均值为0。
[0086][0087]
下式表示批归一化,它在标准规范化的基础上加上了一个线性变化,γ和β的取值是反向传播的过程中模型学习的参数。
[0088][0089]
步骤四:对数据进行混类增强操作
[0090]
目前对于网络请求数据分类任务,往往采用大规模深度神经网络加以实现,它们训练模型以使训练数据的平均误差最小化,即经验风险最小化原则。本发明期望增加模型的泛化能力,减少模型对噪声的敏感性,提升模型训练时的稳定性。对此,考虑增加样本的多样性,使得模型能够从丰富的样本数据中学习到一般规律,提升其泛化能力,本发明引入了数据增强策略,可以实现对每一类的样本分别进行数据扩增,属于同类增强,但是这种方法与数据集密切相关,且需要一定的领域知识。
[0091]
本发明提出一种独立于数据集的数据扩增方式,通过挖掘出不同类不同样本之间的关系,构建虚拟的数据样本。本发明引入并改进了mixup的思想,按照一定的权重对训练集中随机抽取出的两个样本以及它们的标签进行加权求和,实现虚拟数据样本的构建。公式如下:
[0092][0093][0094][0095]
其中,x
ja
是增强前的网络请求数据样本,y
ja
是增强前的网络请求数据样本标签,beta()是贝塔函数,是增强后的网络请求数据样本,是增强后的网络请求数据样本标签,符号λ表示组合的权重,超参数γ控制特征-标签对之间的插值强度。通过数据增强操
作,获得增强后的网络请求数据。
[0096]
步骤五:对网络请求数据进行特征提取操作
[0097]
本步骤中采用的卷积神经网络网络包含连续的3层卷积,第1层卷积负责提取一些低级的特征,第2和第3层卷积利用低级的特征进行迭代提取,获得数据全局的更深层更复杂的特征。第1层卷积使用双曲正切激活函数,第2和第3层使用指数线性单元激活函数,具体如下:
[0098]
x1=tanh(b1+w1*r1)
[0099][0100]
其中,m=2或3。上述公式分别为第1层卷积和第2、3层卷积的的计算过程。其中,xm为第m层卷积的输出,bm为偏置参数,rm为第m层的数据特征值,r
m-1
为第m-1层的数据特征值,wm为卷积核,“*”表示卷积运算,exp是以自然常数e为底的指数函数。
[0101]
在卷积层后设置注意力模块。为获得对网络请求数据分类具有判别性的关键特征,提高检测精度,本发明引入注意力层以使模型可以动态地关注有助于执行当下决策的数据特征。注意力层负责计算多个向量或向量组的加权平均。注意力机制对每个从卷积层输出的数据流向量组计算注意力分布,得到注意力权重,最后加权得到数据流最终的向量表示。注意力权重系数αi为:
[0102][0103]
其中,为数据的深层特征的特征向量,exp是以自然常数e为底的指数函数,xw为上下位置相关的选择向量,用来评估的重要性。加权得到的向量特征s为:
[0104]
s=∑αixi[0105]
其中,xi表示未对数据的深层特征进行转置的特征向量。
[0106]
在注意力模块后增加池化层。池化计算用来压缩数据和减少参数数量,以减小计算量,提高下层网络的处理效率,同时防止过拟合,提高模型整体的泛化能力和收敛速度。池化层的操作与卷积层基本相同,下采样的卷积核对输入的向量取对应位置的最大值,其计算过程为:
[0107][0108]
其中,h
out
和w
out
为输出向量的高度和宽度,t为滤波器每次扫描的步长,h
in
和h
filter
分别为输入向量和滤波器的高度,w
in
和w
filler
分别为输入向量和滤波器的宽度。
[0109]
步骤六:利用softmax分类器进行分类。
[0110]
网络请求数据通过特征提取操作以后,经过softmax分类器进行归一化处理后,即可以得到预测的网络请求数据所属的类别概率,softmax函数的计算方法如下式所示:
[0111][0112]
损失函数l
xent
如下式所示:
[0113][0114]
其中,yi为网络请求数据真实类别的one-hot表示,pi为网络请求数据所属类别概率,c为类别数。
[0115]
本实施例的具体实现方案可以参见上述实施例中的相关说明,此处不再赘述。
[0116]
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
[0117]
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
[0118]
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0119]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行装置执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0120]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0121]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0122]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0123]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0124]
采用了本发明的信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质,具有较高的分类精度,且所提出的模型具有较高的鲁棒性和泛化能力。此外,本发明能够有效避免训练样本不足给模型性能造成负面影响的情况。
[0125]
在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。

技术特征:
1.一种信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的方法包括以下步骤:(1)获取网络请求数据;(2)把数据转换为机器能够识别的向量样本;(3)对数据进行批归一化处理操作;(4)对数据进行混类增强操作;(5)对网络请求数据进行特征提取操作;(6)利用softmax分类器进行分类。2.根据权利要求1所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(1)具体包括以下步骤:(1.1)获取网络请求数据;(1.2)进行人工进行标注,通过利用带标签的数据进行人工智能模型的训练。3.根据权利要求1所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(2)具体包括以下步骤:(2.1)建立word2vec模型;(2.2)通过word2vec模型训练数据得到向量样本。4.根据权利要求1所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(3)中进行批归一化处理,具体为:根据以下公式进行批归一化处理:其中,z
(i)
为原激活值,为经过批归一化变化之后的激活值,γ和β的取值是反向传播的过程中模型学习的参数。5.根据权利要求1所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(5)具体包括以下步骤:(5.1)通过连续3层卷积的第1层卷积提取低级的特征,通过第2层和第3层卷积利用低级的特征进行迭代提取;(5.2)在卷积层后设置注意力模块,通过注意力层计算多个向量或向量组的加权平均;(5.3)在注意力模块后增加池化层,通过池化层进行池化计算。6.根据权利要求1所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(6)具体包括以下步骤:通过softmax分类器进行归一化处理后,得到预测的网络请求数据所属的类别概率,计算损失函数l
xent
。7.根据权利要求6所述的信创环境下基于人工智能实现网络请求数据分类的方法,其特征在于,所述的步骤(6)中计算损失函数l
xent
,具体为:根据以下公式计算损失函数l
xent

其中,y
i
为网络请求数据真实类别的one-hot表示,p
i
为网络请求数据所属类别概率,c为类别数。8.一种用于实现信创环境下基于人工智能的网络请求数据分类的装置,其特征在于,所述的装置包括:处理器,被配置成执行计算机可执行指令;存储器,存储一个或多个计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现权利要求1至7中任一项所述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。9.一种用于实现信创环境下基于人工智能的网络请求数据分类的处理器,其特征在于,所述的处理器被配置成执行计算机可执行指令,所述的计算机可执行指令被所述的处理器执行时,实现权利要求1至7中任一项所述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述的计算机程序可被处理器执行以实现权利要求1至7中任一项所述的信创环境下基于人工智能实现网络请求数据分类的方法的各个步骤。

技术总结
本发明涉及一种信创环境下基于人工智能实现网络请求数据分类的方法,包括以下步骤:获取网络请求数据;把数据转换为机器能够识别的向量样本;对数据进行批归一化处理操作;对数据进行混类增强操作;对网络请求数据进行特征提取操作;利用Softmax分类器进行分类。本发明还涉及一种用于实现信创环境下基于人工智能的网络请求数据分类的装置、处理器及存储介质。采用了本发明的信创环境下基于人工智能实现网络请求数据分类的方法、装置、处理器及其计算机可读存储介质,具有较高的分类精度,且所提出的模型具有较高的鲁棒性和泛化能力。此外,本发明能够有效避免训练样本不足给模型性能造成负面影响的情况。能造成负面影响的情况。能造成负面影响的情况。


技术研发人员:王贺 魏明 李卜
受保护的技术使用者:普元信息技术股份有限公司
技术研发日:2023.05.30
技术公布日:2023/8/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐