一种网络适配器与高性能计算集群的服务器通信连接方法与流程

未命名 10-25 阅读:68 评论:0


1.本发明属于通信连接技术领域,涉及到一种网络适配器与高性能计算集群的服务器通信连接方法。
技术背景
2.计算机集群是一种计算机系统,它通过一组松散集成的计算机硬件和软件连接起来,高度紧密地协作完成计算工作,在某种意义上,它们可以被看作一台计算机,但是现有的服务器数据连接方式不能满足数据系统的发展需求,由此凸显了对服务器连接方式分析的必要性。
3.目前对于服务器数据连接方式主要是针对数据格式的转换,没有依据服务器的节点进行分析,具有一定的局限性,很显然,当前对于服务器数据连接方式分析管理还存在以下几点不足:
4.1)当前在一定程度上阻碍了数据的流动与共享,无法有效提高数据交换的效率,增加了信息传递的时间,从而无法提高资源利用率,在一定程度上增加了用户等待时间,无法提高用户对数据交换平台的青睐,同时还增加了数据复杂度的管理;
5.2)当前无法降低后台的工作量,导致数据交换平台端口出现等待时间过长现象,进而无法提高数据交换平台的运行效率,无法有效的优化数据交换平台的响应速度和处理能力,进而还有可能导致网络环境不稳定会导致数据传输中断或延迟,无法提高数据管理效率。


技术实现要素:

6.鉴于以上现有技术存在的问题,本发明提供一种网络适配器与高性能计算集群的服务器通信连接方法,用于解决据上述技术问题。
7.为了实现上述目的及其他目的,本发明采用的技术方案如下:本发明提供了一种网络适配器与高性能计算集群的服务器通信连接方法,该方法包括以下步骤:
8.步骤一、平台反馈信息获取:获取目标反馈平台对应的故障信息;
9.步骤二、服务器筛选分析:筛选得出故障服务器,并同步获取故障服务器对应的基本信息;
10.步骤三、故障原因筛分:分析得出故障服务器对应的故障原因,其中,故障原因分为机器原因和线路原因;
11.步骤四、故障原因归类:若识别得出故障服务器对应的故障原因为机器原因,则执行步骤五,反之则执行步骤六;
12.步骤五、机器原因分析:对故障服务器进行分析,由此分析得出故障服务器对应的故障节点;
13.步骤六、故障反馈终端:将故障服务器对应的故障原因或故障节点反馈至显示终端。
14.进一步地,上述步骤一中目标反馈平台对应的故障信息包括故障起始时间点和故障ip地址。
15.进一步地,上述步骤二中筛选得出故障服务器的具体筛选过程如下:
16.s3-1、根据目标反馈平台对应的故障信息,从中提取出目标反馈平台对应的故障ip地址,并依据目标反馈平台对应的故障ip地址从中定位得出故障ip地址对应的网络适配器,并将故障ip地址对应的网络适配器标记为故障网络适配器,并获取故障网络适配器对应的编号;
17.s3-2、依据故障网络适配器对应的编号,从平台信息库中存储的各编号对应网络适配器的参考信息中提取出故障网络适配器对应的参考信息,其中,参考信息包括连接服务器数目;
18.s3-3、根据在各服务器中布设的监测仪器,由此得出各服务器在各监测时间点对应的运行温度,将各监测时间点与故障起始时间点进行比对,由此筛选得出各目标监测时间点,由此得出各服务器在各目标监测时间点对应的运行温度;
19.s3-4、从平台信息库中提取出故障服务器对应的参考异常温度区间,将各服务器在各目标监测时间点对应的运行温度与故障服务器对应的参考异常温度区间进行比对,若存在有某服务器在某目标监测时间点对应的运行温度在故障服务器对应的参考异常温度区间内且某目标监测时间点后的各目标监测时间点对应的运行温度均在故障服务器对应的参考异常温度区间内,则将该服务器标记为故障服务器。
20.进一步地,上述步骤二中故障服务器对应的基本信息包括连接节点数目、各节点对应的连接光纤数目和各光纤对应各目标时间点的电流值和电压值。
21.进一步地,上述步骤三中分析得出故障服务器对应的故障原因的具体分析过程如下:
22.s5-1、依据故障服务器对应的基本信息,从中提取出故障服务器对应各节点中各光纤各目标时间点的电流值和电压值,进而筛选出故障服务器对应各节点中各光纤在故障时间段内各参考时间点实时电流值和实时电压值,将其标记为λ
ywt
和η
ywt
,其中,y表示为各节点对应的编号,y=1,2,.......p,w表示为各光纤对应的编号,w=1,2,.......q,t表示为各参考时间点对应的编号,t=1,2,......u;
23.s5-2、利用公式计算得出故障服务器对应故障时间段的实时功率值α,其中,p表示为节点总数目,q表示为光纤总数目;
24.s5-3、从平台信息库中提取出服务器标准功率值区间,并将故障服务器对应故障时间段的实时功率值与服务器标准功率值区间进行比对,若故障服务器对应故障时间段的实时功率值在服务器标准功率值区间内,则判定故障服务器对应的故障原因为机器原因,反之则判定故障服务器对应的故障原因为线路原因。
25.进一步地,上述步骤五中分析得出故障服务器对应的故障节点的具体分析过程如下:
26.s6-1、根据平台信息库中存储各服务器对应各节点的上传信息,进而提取出故障服务器对应各节点在故障时间段内的上传信息,其中,上传信息包括文件类型和文件容量;
27.s6-2、将故障服务器对应各节点在故障时间段内的上传文件类型与平台信息库存储的各文件上传耗时等级对应的文件类型进行比对,由此得到故障服务器对应各节点在故障时间段内的文件上传耗时等级,并将其标记为βy;
28.s6-3、依据平台信息库中存储的各服务器对应各节点的端口传输速率,进而提取出故障服务器对应各节点的端口传输速率,通过计算得出故障服务器对应各节点的文件传输时长ty。
29.进一步地,上述分析得出故障服务器对应各节点的文件传输时长,具体分析过程如下:
30.依据分析公式计算得出故障服务器对应各节点的文件传输时长ty,其中,e表示为自然常数,表示为故障服务器对应第y个节点的端口传输速率,υy表示为故障服务器对应第y个节点在故障时间段内的上传文件容量,υ

表示为设定的单位文件上传时长对应的参考文件容量,c1和c2分别表示为设定的文件上传耗时等级和文件容量对应的影响因子。
31.进一步地,上述步骤五中分析得出故障服务器对应的故障节点的具体分析过程还包括以下步骤:
32.s8-1、根据平台信息库中存储各服务器对应各节点的数据交换端口数目,从中调取得出故障服务器对应各节点的数据交换端口数目,通过计算得出故障服务器对应各节点的端口数据平均响应时间δy,my′
表示为故障服务器对应第y个节点的数据交换端口数目;
33.s8-2、利用计算公式计算得出故障服务器对应各节点的端口数据吞吐量φy,并将故障服务器对应各节点的端口数据吞吐量与预定义的标准端口数据吞吐量进行比对,若故障服务器对应某节点的端口数据吞吐量小于标准端口数据吞吐量,则判定该节点为故障节点,由此得出故障服务器对应的故障节点。
34.进一步地,上述一种网络适配器与高性能计算集群的服务器通信连接方法在实际应用过程中用到平台信息库,用于存储各编号对应网络适配器的参考信息、各服务器对应各节点的上传信息和数据交换端口数目,用于存储故障服务器对应的参考异常温度区间和服务器标准功率值区间,用于存储各文件上传耗时等级对应的文件类型,还用于存储各服务器对应各节点的端口传输速率。
35.本发明提供的一种网络适配器与高性能计算集群的服务器通信连接方法,相比现有技术至少具有以下有益效果:
36.(1)本发明提供的一种网络适配器与高性能计算集群的服务器通信连接方法,通过获取目标反馈平台对应的故障信息,筛选得出故障服务器,并同步获取故障服务器对应的基本信息,进而分析得出故障服务器对应的故障原因并分析得出故障服务器对应的故障
节点,最终将故障服务器对应的故障原因或故障节点反馈至显示终端,有效的解决了当前技术对服务器数据分析还存在一定局限性问题,在一定程度上加强了数据的流动与共享,有效的提高了数据交换的效率,降低了信息传递的时间,从而提高了资源利用率,在一定程度上降低了用户等待时间,提高了用户对数据交换平台的青睐,同时还避免了数据复杂度的管理。
37.(2)本发明能降低了后台的工作量,避免导致数据交换平台端口出现等待时间过长现象,提高了数据交换平台的运行效率,同时还能有效的优化数据交换平台的响应速度和处理能力,避免导致网络环境不稳定会导致数据传输中断或延迟,提高了数据管理效率。
附图说明
38.图1为本发明的方法各步骤连接示意图。
具体实施方式
39.实施例1:请参阅图1所示,一种网络适配器与高性能计算集群的服务器通信连接方法,该方法包括以下步骤:
40.步骤一、平台反馈信息获取:获取目标反馈平台对应的故障信息;
41.目标反馈平台对应的故障信息包括故障起始时间点和故障ip地址;
42.步骤二、服务器筛选分析:筛选得出故障服务器,并同步获取故障服务器对应的基本信息;
43.筛选得出故障服务器的具体筛选过程如下:
44.s3-1、根据目标反馈平台对应的故障信息,从中提取出目标反馈平台对应的故障ip地址,并依据目标反馈平台对应的故障ip地址从中定位得出故障ip地址对应的网络适配器,并将故障ip地址对应的网络适配器标记为故障网络适配器,并获取故障网络适配器对应的编号;
45.s3-2、依据故障网络适配器对应的编号,从平台信息库中存储的各编号对应网络适配器的参考信息中提取出故障网络适配器对应的参考信息,其中,参考信息包括连接服务器数目;
46.s3-3、根据在各服务器中布设的监测仪器,由此得出各服务器在各监测时间点对应的运行温度,将各监测时间点与故障起始时间点进行比对,由此筛选得出各目标监测时间点,由此得出各服务器在各目标监测时间点对应的运行温度;
47.s3-4、从平台信息库中提取出故障服务器对应的参考异常温度区间,将各服务器在各目标监测时间点对应的运行温度与故障服务器对应的参考异常温度区间进行比对,若存在有某服务器在某目标监测时间点对应的运行温度在故障服务器对应的参考异常温度区间内且某目标监测时间点后的各目标监测时间点对应的运行温度均在故障服务器对应的参考异常温度区间内,则将该服务器标记为故障服务器;
48.其中,故障服务器对应的基本信息包括连接节点数目、各节点对应的连接光纤数目和各光纤对应各目标时间点的电流值和电压值;
49.步骤三、故障原因筛分:分析得出故障服务器对应的故障原因,其中,故障原因分为机器原因和线路原因;
50.分析得出故障服务器对应的故障原因的具体分析过程如下:
51.s5-1、依据故障服务器对应的基本信息,从中提取出故障服务器对应各节点中各光纤各目标时间点的电流值和电压值,进而筛选出故障服务器对应各节点中各光纤在故障时间段内各参考时间点实时电流值和实时电压值,将其标记为λ
ywt
和η
ywt
,其中,y表示为各节点对应的编号,y=1,2,.......p,w表示为各光纤对应的编号,w=1,2,.......q,t表示为各参考时间点对应的编号,t=1,2,......u;
52.s5-2、利用公式计算得出故障服务器对应故障时间段的实时功率值α,其中,p表示为节点总数目,q表示为光纤总数目;
53.s5-3、从平台信息库中提取出服务器标准功率值区间,并将故障服务器对应故障时间段的实时功率值与服务器标准功率值区间进行比对,若故障服务器对应故障时间段的实时功率值在服务器标准功率值区间内,则判定故障服务器对应的故障原因为机器原因,反之则判定故障服务器对应的故障原因为线路原因。
54.步骤四、故障原因归类:若识别得出故障服务器对应的故障原因为机器原因,则执行步骤五,反之则执行步骤六;
55.步骤五、机器原因分析:对故障服务器进行分析,由此分析得出故障服务器对应的故障节点;
56.其中,分析得出故障服务器对应的故障节点的具体分析过程如下:
57.s6-1、根据平台信息库中存储各服务器对应各节点的上传信息,进而提取出故障服务器对应各节点在故障时间段内的上传信息,其中,上传信息包括文件类型和文件容量;
58.s6-2、将故障服务器对应各节点在故障时间段内的上传文件类型与平台信息库存储的各文件上传耗时等级对应的文件类型进行比对,由此得到故障服务器对应各节点在故障时间段内的文件上传耗时等级,并将其标记为βy;
59.s6-3、依据平台信息库中存储的各服务器对应各节点的端口传输速率,进而提取出故障服务器对应各节点的端口传输速率,通过计算得出故障服务器对应各节点的文件传输时长ty;
60.其中,分析得出故障服务器对应各节点的文件传输时长的具体分析过程如下:
61.依据分析公式计算得出故障服务器对应各节点的文件传输时长ty,其中,e表示为自然常数,表示为故障服务器对应第y个节点的端口传输速率,υy表示为故障服务器对应第y个节点在故障时间段内的上传文件容量,υ

表示为设定的单位文件上传时长对应的参考文件容量,c1和c2分别表示为设定的文件上传耗时等级和文件容量对应的影响因子。
62.其中,分析得出故障服务器对应的故障节点的具体分析过程还包括以下步骤:
63.s8-1、根据平台信息库中存储各服务器对应各节点的数据交换端口数目,从中调取得出故障服务器对应各节点的数据交换端口数目,通过计算得出故障服务器对
应各节点的端口数据平均响应时间δy,my′
表示为故障服务器对应第y个节点的数据交换端口数目;
64.s8-2、利用计算公式计算得出故障服务器对应各节点的端口数据吞吐量φy,并将故障服务器对应各节点的端口数据吞吐量与预定义的标准端口数据吞吐量进行比对,若故障服务器对应某节点的端口数据吞吐量小于标准端口数据吞吐量,则判定该节点为故障节点,由此得出故障服务器对应的故障节点。
65.本发明的上述方法降低了后台的工作量,避免导致数据交换平台端口出现等待时间过长现象,提高了数据交换平台的运行效率,同时还能有效的优化数据交换平台的响应速度和处理能力,避免导致网络环境不稳定会导致数据传输中断或延迟,提高了数据管理效率。
66.步骤六、故障反馈终端:将故障服务器对应的故障原因或故障节点反馈至显示终端。
67.本发明的方法在实际应用过程中用到平台信息库,用于存储各编号对应网络适配器的参考信息、各服务器对应各节点的上传信息和数据交换端口数目,用于存储故障服务器对应的参考异常温度区间和服务器标准功率值区间,用于存储各文件上传耗时等级对应的文件类型,还用于存储各服务器对应各节点的端口传输速率。
68.本发明提供的一种网络适配器与高性能计算集群的服务器通信连接方法,通过获取目标反馈平台对应的故障信息,筛选得出故障服务器,并同步获取故障服务器对应的基本信息,进而分析得出故障服务器对应的故障原因并分析得出故障服务器对应的故障节点,最终将故障服务器对应的故障原因或故障节点反馈至显示终端,有效的解决了当前技术对服务器数据分析还存在一定局限性问题,在一定程度上加强了数据的流动与共享,有效的提高了数据交换的效率,降低了信息传递的时间,从而提高了资源利用率,在一定程度上降低了用户等待时间,提高了用户对数据交换平台的青睐,同时还避免了数据复杂度的管理。
69.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。

技术特征:
1.一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,该方法包括以下步骤:步骤一、平台反馈信息获取:获取目标反馈平台对应的故障信息;步骤二、服务器筛选分析:筛选得出故障服务器,并同步获取故障服务器对应的基本信息;步骤三、故障原因筛分:分析得出故障服务器对应的故障原因,其中,故障原因分为机器原因和线路原因;步骤四、故障原因归类:若识别得出故障服务器对应的故障原因为机器原因,则执行步骤五,反之则执行步骤六;步骤五、机器原因分析:对故障服务器进行分析,由此分析得出故障服务器对应的故障节点;步骤六、故障反馈终端:将故障服务器对应的故障原因或故障节点反馈至显示终端。2.根据权利要求1所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤一中目标反馈平台对应的故障信息包括故障起始时间点和故障ip地址。3.根据权利要求1或2所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤二中筛选得出故障服务器的具体筛选步骤如下:s3-1、根据目标反馈平台对应的故障信息,从中提取出目标反馈平台对应的故障ip地址,并依据目标反馈平台对应的故障ip地址从中定位得出故障ip地址对应的网络适配器,并将故障ip地址对应的网络适配器标记为故障网络适配器,并获取故障网络适配器对应的编号;s3-2、依据故障网络适配器对应的编号,从平台信息库中存储的各编号对应网络适配器的参考信息中提取出故障网络适配器对应的参考信息,其中,参考信息包括连接服务器数目;s3-3、根据在各服务器中布设的监测仪器,由此得出各服务器在各监测时间点对应的运行温度,将各监测时间点与故障起始时间点进行比对,由此筛选得出各目标监测时间点,由此得出各服务器在各目标监测时间点对应的运行温度;s3-4、从平台信息库中提取出故障服务器对应的参考异常温度区间,将各服务器在各目标监测时间点对应的运行温度与故障服务器对应的参考异常温度区间进行比对,若存在有某服务器在某目标监测时间点对应的运行温度在故障服务器对应的参考异常温度区间内且某目标监测时间点后的各目标监测时间点对应的运行温度均在故障服务器对应的参考异常温度区间内,则将该服务器标记为故障服务器。4.根据权利要求1所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤二中故障服务器对应的基本信息包括连接节点数目、各节点对应的连接光纤数目和各光纤对应各目标时间点的电流值和电压值。5.根据权利要求4所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤三中分析得出故障服务器对应的故障原因的具体分析步骤如下:s5-1、依据故障服务器对应的基本信息,从中提取出故障服务器对应各节点中各光纤各目标时间点的电流值和电压值,进而筛选出故障服务器对应各节点中各光纤在故障时间
段内各参考时间点实时电流值和实时电压值,将其标记为λ
ywt
和η
ywt
,其中,y表示为各节点对应的编号,y=1,2,.......p,w表示为各光纤对应的编号,w=1,2,.......q,t表示为各参考时间点对应的编号,t=1,2,......u;s5-2、利用公式计算得出故障服务器对应故障时间段的实时功率值α,其中,p表示为节点总数目,q表示为光纤总数目;s5-3、从平台信息库中提取出服务器标准功率值区间,并将故障服务器对应故障时间段的实时功率值与服务器标准功率值区间进行比对,若故障服务器对应故障时间段的实时功率值在服务器标准功率值区间内,则判定故障服务器对应的故障原因为机器原因,反之则判定故障服务器对应的故障原因为线路原因。6.根据权利要求1或5所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤五中分析得出故障服务器对应的故障节点的具体分析步骤如下:s6-1、根据平台信息库中存储各服务器对应各节点的上传信息,进而提取出故障服务器对应各节点在故障时间段内的上传信息,其中,上传信息包括文件类型和文件容量;s6-2、将故障服务器对应各节点在故障时间段内的上传文件类型与平台信息库存储的各文件上传耗时等级对应的文件类型进行比对,由此得到故障服务器对应各节点在故障时间段内的文件上传耗时等级,并将其标记为β
y
;s6-3、依据平台信息库中存储的各服务器对应各节点的端口传输速率,进而提取出故障服务器对应各节点的端口传输速率,通过计算得出故障服务器对应各节点的文件传输时长t
y
。7.根据权利要求6所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述分析得出故障服务器对应各节点的文件传输时长的具体分析方法为:依据分析公式计算得出故障服务器对应各节点的文件传输时长t
y
,其中,e表示为自然常数,表示为故障服务器对应第y个节点的端口传输速率,υ
y
表示为故障服务器对应第y个节点在故障时间段内的上传文件容量,υ

表示为设定的单位文件上传时长对应的参考文件容量,c1和c2分别表示为设定的文件上传耗时等级和文件容量对应的影响因子。8.根据权利要求7所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述步骤五中分析得出故障服务器对应的故障节点的具体分析过程还包括以下步骤:s8-1、根据平台信息库中存储各服务器对应各节点的数据交换端口数目,从中调取得出故障服务器对应各节点的数据交换端口数目,通过计算得出故障服务器对应各节点的端口数据平均响应时间δ
y
,m

y
表示为故障服务器对应第y个节点的数据交换端口数目;
s8-2、利用计算公式计算得出故障服务器对应各节点的端口数据吞吐量φ
y
,并将故障服务器对应各节点的端口数据吞吐量与预定义的标准端口数据吞吐量进行比对,若故障服务器对应某节点的端口数据吞吐量小于标准端口数据吞吐量,则判定该节点为故障节点,由此得出故障服务器对应的故障节点。9.根据权利要求1所述的一种网络适配器与高性能计算集群的服务器通信连接方法,其特征在于,所述方法用到平台信息库时,用于存储各编号对应网络适配器的参考信息、各服务器对应各节点的上传信息和数据交换端口数目,用于存储故障服务器对应的参考异常温度区间和服务器标准功率值区间,用于存储各文件上传耗时等级对应的文件类型,还用于存储各服务器对应各节点的端口传输速率。

技术总结
本发明涉及通信连接技术领域,涉及到一种网络适配器与高性能计算集群的服务器通信连接方法,通过获取目标反馈平台对应的故障信息,筛选得出故障服务器,并同步获取故障服务器对应的基本信息,进而分析得出故障服务器对应的故障原因并分析得出故障服务器对应的故障节点,最终将故障服务器对应的故障原因或故障节点反馈至显示终端,在一定程度上加强了数据的流动与共享,有效的提高了数据交换的效率,降低了信息传递的时间,从而提高了资源利用率,在一定程度上降低了用户等待时间,提高了用户对数据交换平台的青睐,同时还避免了数据复杂度的管理,同时还能有效的优化数据交换平台的响应速度和处理能力。平台的响应速度和处理能力。平台的响应速度和处理能力。


技术研发人员:李洵 卫薇 钟掖 甘润东 龙玉江 王策 袁捷 卢仁猛
受保护的技术使用者:贵州电网有限责任公司
技术研发日:2023.08.01
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐