分布式存储方法、装置、设备及介质与流程
未命名
08-03
阅读:85
评论:0

1.本发明一般涉及人工智能技术领域,具体涉及一种分布式存储方法、装置、设备及介质。
背景技术:
2.随着医疗技术和信息处理技术的不断发展,医疗影像文件作为医疗数据可视化的文件能够辅助医生做出关于诊断、治疗、预后等决策,已经广泛得应用在医疗领域中,其能够为医生提供诊断、处方等决策支持。其中,使用电子计算机断层扫描(computed tomography,ct)对患者进行检查产生的医疗影像文件数量达到一万幅以上,设备生成的医疗数字影像传输协定(digitalimaging andcommunications inmedicine,dicom)文件也需要占用更多的磁盘空间。
3.目前,在医生阅片写诊断报告的高峰时段,高速磁盘属于高负荷状态,与此同时存储服务器需要将大数据量的dicom数据通过核心交换机传送至医生电脑工作站,导致网络压力增大,使得医生调用影像时出现下载影像速度慢,阅片卡顿等情况,影响了工作效率。
技术实现要素:
4.鉴于现有技术中的上述缺陷或不足,期望提供一种分布式存储方法、装置、设备及介质。
5.第一方面,本技术实施例提供了一种分布式存储方法,该方法包括:获取待处理医疗影像文件;对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径;基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。
6.在其中一个实施例中,对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像,包括:对待处理医疗影像文件进行解析处理,获取检查描述信息、图像位数和图像坐标信息;基于检查描述信息、图像位数和图像坐标信息确定解析结果;当解析结果用于表征待处理医疗影像文件为心脏冠状动脉断层扫描检查和横断位切片图像的灰度数据时,将医疗影像文件通过心脏区域识别模型进行分类处理,得到心脏区域图像和其他区域图像;心脏区域识别模型是基于历史医疗影像文件和心脏区域标注结果进行训练得到的。
7.在其中一个实施例中,将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的阅片工作站的图像存储路径,包括:将待处理医疗影像文件输入工作站预测模型中的特征提取模块进行特征提取,得到医疗影像特征;将医疗影像特征通过工作站预测模型中的分类模块进行分类处理,确定待处理医疗影像文件的目标阅片工作站;基于目标阅片工作站,确定目标阅片工作站的图像存储路径。
8.在其中一个实施例中,基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘,包括:获取每个磁盘的特征参数;特征参数包括时间属性特征和磁盘属性特征;将待处理医疗影像文件和特征参数输入每个网络时间预测模型进行预测处理,得到每个磁盘对应的网络传输时间;按照大小对所有网络传输时间的进行排序,确定最小的网络传输时间;将所有磁盘中最小的网络传输时间对应的磁盘作为目标磁盘。
9.在其中一个实施例中,每个网络传输时间预测模型的训练过程包括如下步骤:获取磁盘的历史特征数据和历史特征参数;历史特征参数包括历史时间属性特征和历史磁盘属性特征;历史特征数据标注有网络传输耗时标注结果;将历史时间属性特征、历史特征数据和历史磁盘属性特征输入初始神经网络模型进行处理,得到网络传输耗时预测结果;基于网络传输耗时预测结果和网络传输耗时标注结果,构建损失函数,按照损失函数最小化对初始神经网络模型进行迭代处理,得到网络传输时间预测模型。
10.在其中一个实施例中,在将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库之后,方法还包括:当检测到心脏区域图像访问操作时,基于目标阅片工作站的图像存储路径获取心脏区域图像;心脏区域图像是待处理医疗影像文件中包括心脏区域的横断位灰度图像;当检测到其他区域图像获取操作时,获取存储路径记录,并基于存储路径记录获取目标磁盘地址,访问目标磁盘地址获取其他区域图像;其他区域图像是待处理医疗影像文件中除心脏区域图像之外的其他图像。
11.在其中一个实施例中,包括:时间属性特征包括以下至少一项:高峰时段特征和非高峰时段特征;待处理医疗影像文件包括以下至少一项:检查图像数量、检查图像文件总大小;磁盘属性特征包括以下至少一项:磁盘类型、磁盘使用率和磁盘读取速度。
12.第二方面,本技术提供了一种分布式存储装置,该装置包括:获取模块,用于获取待处理医疗影像文件;分类模块,用于对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;工作站预测模块,用于将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径;
目标磁盘确定模块,用于基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;存储模块,用于将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。
13.第三方面,本技术实施例提供一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如上述第一方面的分布式存储方法。
14.第四方面,本技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于实现如上第一方面的分布式存储方法。
15.本技术实施例中提供的分布式存储方法、装置、设备及存储介质,通过获取待处理医疗影像文件,并对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像,然后将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径,并基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘,然后将其他目标区域图像存储至目标磁盘,将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。该技术方案能够根据医生对影像文件的重点关注程度进行分类处理,以得到关注度较高的心脏区域图像和其他区域图像,并通过工作站预测模型对待处理医疗影像文件进行处理,从而精准地确定出当前时间内待处理医疗影像文件的推荐的存储位置并存储,使得医生阅片调用该影像文件时,直接访问医生电脑工作站下的存储路径,并对其他区域图像从可以服务器对应的存储位置下载,实现了降低存储服务器的网络压力,并负载均衡高速磁盘和低速磁盘的使用率,实现万幅图像阅片秒开的效果,有效缩减了医疗影像文件传输到医生阅片工作站的时间,有效提高工作效率。
附图说明
16.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:图1为本技术实施例提供的分布式存储系统的结构示意图;图2为本技术实施例提供的分布式存储方法的流程示意图;图3为本技术实施例提供的基于待处理医疗影像文件和每个磁盘对应的络传输时间预测模型,确定目标磁盘方法的流程示意图;图4为本技术实施例提供的网络时间预测模型的训练过程方法的流程示意图;图5为本技术实施例提供的分布式存储装置的结构示意图;图6为本技术实施例示出的一种计算机设备的结构示意图。
具体实施方式
17.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
18.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相
互组合。下面将参考附图并结合实施例来详细说明本技术。
19.如背景技术中提到的,随着医疗影像逐渐成为医疗诊断应用的重要手段,各个医院院内影像归档和通信系统(picture archiving and communication system,pacs)系统产生的影像数据呈快速增长趋势。其中,pacs系统通用的文件存储是将近期影像数据存储在高速磁盘,将历史影像数据存储在低速磁盘,并定时将超过设定日期的高速磁盘。
20.目前,在医生阅片写诊断报告的高峰时段,高速磁盘属于高负荷状态,与此同时存储服务器需要将大数据量的dicom数据通过核心交换机传送至医生电脑工作站,导致网络压力增大,使得医生调用影像时出现下载影像速度慢,阅片卡顿等情况,影响了工作效率。
21.基于上述缺陷,本技术提供了一种分布式存储方法、装置、设备及介质,与现有技术相比,该技术方案能够根据医生对影像文件的重点关注程度进行分类处理,以得到关注度较高的心脏区域图像和其他区域图像,并通过工作站预测模型对待处理医疗影像文件进行处理,从而精准地确定出当前时间内待处理医疗影像文件的推荐的存储位置并存储,使得医生阅片调用该影像文件时,直接访问医生电脑工作站下的存储路径,并对其他区域图像从可以服务器对应的存储位置下载,实现了降低存储服务器的网络压力,并负载均衡高速磁盘和低速磁盘的使用率,实现万幅图像阅片秒开的效果,有效缩减了医疗影像文件传输到医生阅片工作站的时间,有效提高工作效率。
22.图1是本技术实施例提供的一种分布式存储方法的实施环境架构图。如图1所示,该实施环境架构包括:服务器100和阅片工作站200。
23.上述服务器100可以是pacs存储服务器,用于获取待处理医疗影像文件,并对待处理医疗影像文件进行分类存储,得到存储结果。
24.其中,上述服务器100可以是一台服务器,也可以是由若干台服务器构成的服务器集群,或者服务器100可以包含一个或多个虚拟化平台,或者服务器100可以是一个云计算服务中心。
25.上述阅片工作站200可以是终端设备,该终端设备可以是智能电视、智能电视机顶盒等智能家居设备,或者可以是智能手机、平板电脑以及电子书阅读器等移动式便携终端,或者,还可以是智能眼镜、智能手表等智能可穿戴设备,本实施例对此不进行具体限定。上述阅片工作站中可以包括多个存储路径,每个存储路径用于存储相应文件。
26.服务器100和阅片工作站200之间通过有线或无线网络建立通信连接。可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(local area network,lan)、城域网(metropolitan area network,man)、广域网(wide area network,wan)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。
27.为了便于理解和说明,下面通过图2至图6详细阐述本技术实施例提供的分布式存储方法、装置、设备及介质。
28.图2所示为本技术实施例的分布式存储方法的流程示意图,该方法可以由计算机设备执行,该计算机设备可以是上述图1所示系统中的服务器100。如图2所示,该方法包括:s101、获取待处理医疗影像文件。
29.上述待处理医疗影像文件是指需要进行分布式存储处理的影像文件。该待处理医疗影像文件可以是利用精确准直的x线束、γ射线、超声波等,与灵敏度极高的探测器一同
围绕人体的某一部位作一个接一个的断面扫描得到的影像文件。其中,该待处理医疗影像文件中采用的扫描方式可以是根据所采用的射线不同分为:x射线ct(x-ct)以及γ射线ct(γ-ct)等方式。
30.可以理解的是,在进行ct扫描检查时,可以是针对检测对象体位、心脏的不同切面,能够获得含有多个序列的待处理医疗影像文件。其中,每个序列可以对应ct扫描检查中的一个切面。上述待处理医疗影像文件可以包括至少一个切面的图像。上述检测对象可以是患者,待处理医疗影像文件可以是对该患者心脏冠状动脉ct检查的影像文件,例如为dicom文件。dicom是用于医学影像处理、储存、打印、传输的一组通用的标准协定。它包含了文件格式的定义以及网络通信协议。dicom是以tcp/ip为基础的应用协定,并以tcp/ip联系各个系统,两个能接收dicom格式的医疗仪器间,可通过dicom格式的文件,来接收与交换影像及病人资料。
31.本实施例中,可以通过数据库获取待处理医疗影像文件,也可以通过数据库或外部设备获取待处理医疗影像文件,还可以是通过ct设备获取得到,具体可以是服务器向ct设备发送影像文件获取指令,使得ct设备接收并响应于该影像文件获取指令,获取影像文件标识,基于影像文件标识查找待处理医疗影像文件并发送至服务器,使得服务器获取待处理医疗影像文件。
32.s102、对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像。
33.需要说明的是,上述心脏区域图像是待处理医疗影像文件中包括心脏区域的横断位灰度图像,上述其他区域图像是待处理医疗影像文件中除所述心脏区域图像之外的其他图像。
34.在获取到待处理医疗影像文件之后,可以根据医生对影像文件的关注程度对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像。例如在对心脏冠状动脉ct检查时,医生需要重点关注的是包括心脏区域的图像,即对包括心脏区域的图像关注度更高,对其他区域图像的关注程度低于包括心脏区域的图像的关注程度。
35.具体地,在对待处理医疗影像文件进行分类处理的过程中,可以先对待处理医疗影像文件进行解析处理,获取检查描述信息、图像位数和图像坐标信息,基于检查描述信息、图像位数和图像坐标信息确定解析结果,当解析结果用于表征待处理医疗影像文件为心脏冠状动脉断层扫描检查和横断位切片图像的灰度数据时,将医疗影像文件通过心脏区域识别模型进行分类处理,得到心脏区域图像和其他区域图像。其中,心脏区域识别模型是基于历史医疗影像文件和心脏区域标注结果进行训练得到的。
36.作为一种可实现方式,上述检查描述信息可以包括扫描检查的检查部位检查方式等信息。在提取到检查描述信息、图像位数和图像坐标信息之后,可以基于检查描述信息,判断待处理医疗影像文件中当前检查序列是否为心脏冠状动脉断层扫描检查;筛选出心脏冠状动脉断层扫描检查的影像文件,然后对心脏冠状动脉断层扫描检查的影像文件的图像位数,确定当前检查序列属于灰度数据或彩色图像数据,筛选出灰度数据,并基于图像坐标信息,确定当前检查序列是否为横断位切片图像,从而得到解析结果。该解析结果可以包括心脏冠状动脉断层扫描检查和横断位切片图像的灰度数据、非心脏区域的横断位灰度图像、后处理三维重建生成的彩色图像数据以及非横断位图像。
37.当解析结果用于表征待处理医疗影像文件为心脏冠状动脉断层扫描检查和横断
位切片图像的灰度数据时,将医疗影像文件通过心脏区域识别模型进行分类处理,具体是通过心脏区域识别模型中的特征提取模块进行特征提取,得到图像区域特征,然后将图像区域特征通过心脏区域识别模型中的分类模块进行分类处理,得到心脏区域,将包括心脏区域的图像作为心脏区域图像,将待处理医疗影像文件中除心脏区域图像之外的其他区域对应的图像作为其他区域图像。
38.可选的,上述心脏区域识别模型可以是卷积神经网络模型cnn,还可以是双流网络、也可以是3d卷积网络,还可以是采用双流网络和3d卷积组合而成的i3d网络,又可以采用resnet残差网络。
39.需要说明的是,上述心脏区域识别模型是一个输入为待处理医疗影像文件,输出为心脏区域图像和其他区域图像的且具有对待处理医疗影像文件进行分类处理的能力,能够预测心脏区域图像结果的神经网络模型。该心脏区域识别模型的模型参数处于最优的状态,可以将待处理医疗影像文件输入心脏区域识别模型,得出心脏区域图像和其他区域图像。其他区域图像可以是包含非心脏区域的横断位灰度图像、后处理三维重建生成的彩色图像数据以及非横断位图像。
40.其中,上述心脏区域识别模型可以通过如下步骤进行训练:获取历史医疗影像文件,历史医疗影像文件中标注有心脏区域标注结果,然后将历史医疗影像文件通过第一神经网络模型进行特征提取,得到样本特征,并对样本特征进行分类和激活函数处理,得到预测结果,基于预测结果和心脏区域标注结果构建损失函数,按照损失函数最小化,对初始神经网络模型进行迭代训练,得到心脏区域识别模型。
41.本实施例中通过对待处理医疗影像文件进行解析处理,获取检查描述信息、图像位数和图像坐标信息,并通过心脏区域识别模型进行分类处理,能够精准地确定出心脏区域图像和其他区域图像。
42.s103、将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径。
43.其中,上述工作站预测模型是一个输入为待处理医疗影像文件,输出为目标阅片工作站的且具有对待处理医疗影像文件进行工作站预测的能力,能够预测目标阅片工作站的神经网络模型。该工作站预测模型的模型参数处于最优的状态,可以将待处理医疗影像文件输入工作站预测模型,得出待处理医疗影像文件的目标阅片工作站。
44.具体地,将待处理医疗影像文件输入工作站预测模型中的特征提取模块进行特征提取,得到医疗影像特征,并将医疗影像特征通过工作站预测模型中的分类模块进行分类处理,确定待处理医疗影像文件的目标阅片工作站,基于目标阅片工作站,确定目标阅片工作站的图像存储路径。
45.其中,服务器可以获取阅片工作站属性信息,该阅片工作站属性信息可以包括医生科室、医生标识、阅片工作站标识、排班信息、阅片顺序等,可以将工作站属性信息和待处理医疗影像文件输入工作站预测模型中的特征提取模块进行特征提取,得到医疗影像特征和工作站属性特征,并将医疗影像特征和工作站属性特征通过工作站预测模型中的分类模块进行分类处理,可以通过全连接层和激活函数计算得到输出结果,该输出结果为待处理医疗影像文件的阅片工作站为目标阅片工作站的概率值。其中,该激活函数可以是softmax函数,激活函数的作用是用来加入非线性因素,因为线性模型的表达能力不够,能够把输入
的连续实值变换为0和1之间的输出。将概率值最大的阅片工作站确定为目标阅片工作站。
46.可以理解的是,医生标识用于唯一表示医生的身份信息,每个医生的排班信息可能不同,也可能相同。
47.可选的,也可以采用基于机器学习的多层感知器(mlp)算法将工作站属性信息和待处理医疗影像文件进行处理,得到待处理医疗影像文件的目标阅片工作站。
48.进一步地,数据库中预先存储有每个阅片工作站与网络地址、图像存储地址之间的映射关系,该映射关系是预先根据实际需求自定义设置的。在确定出目标阅片工作站后,可以根据该映射关系从数据库中获取目标阅片工作站的网络地址以及图像存储路径。
49.可以理解的是,网络地址是指服务器向阅片工作站发送的目标地址,该图像存储路径是阅片工作站上用于存储待处理疗影像文件的存储位置。
50.上述工作站预测模型可以通过如下步骤进行训练:获取历史医疗影像文件,历史医疗影像文件中标注有阅片工作站标注结果,然后将历史医疗影像文件通过第二神经网络模型进行特征提取,得到历史样本特征,并对历史样本特征进行分类和激活函数处理,得到输出结果,基于输出结果和阅片工作站标注结果构建损失函数,按照损失函数最小化,对第二神经网络模型进行迭代训练,得到心脏区域识别模型。
51.本实施例中通过将待处理医疗影像文件通过工作站预测模型进行分类处理,能够精准地确定出目标阅片工作站,进而准确地得到图像存储路径,使得当前检查的待处理医疗影像文件能够精准地推送至医生的阅片工作站。
52.s104、基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘。
53.上述服务器可以包括n个磁盘,n≥1。每个磁盘可以训练有对应的网络传输时间预测模型,该每个网络传输时间预测模型用于预测单个磁盘在预设时间段内的网络传输时间,其中预设时间段可以是根据实际需求自定义设置的时间,例如可以是半小时,也可以是一小时。上述目标磁盘是指服务器上需要存储其他区域图像的位置。每个磁盘对应的内存大小可能相同,也可能不同。
54.其中,上述网络传输时间预测模型可以是训练好的用于预测网络传输时间的循环神经网络模型,其内部的模型参数处于最优状态。
55.计算机设备可以获取每个磁盘的特征参数,然后基于每个磁盘的特征参数和待处理医疗影像文件的医学检查属性特征输入网络时间预测模型进行预测处理,得到网络传输时间。然后将网络传输时间最小的磁盘作为目标磁盘。其中,每个磁盘的特征参数用于表征磁盘对应的特征类别。
56.s105、将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。
57.由于医生对其他区域图像的关注程度低于心脏区域图像的关注程度,因此,为了便于医生能够快速获取关注程度较高的心脏区域图像,可以在获取待处理医疗影像文件对应的目标阅片工作站后,将其他区域图像存储至耗时最短的目标磁盘,对应的磁盘是慢速存储的,即低速磁盘,可以将其他区域感图像进行无损压缩后存储至目标磁盘。并基于网络地址将心脏区域图像存储至目标阅片工作站的图像存储路径,可以并行地将心脏区域图像进行无损压缩后存储至低速磁盘中。然后获取心脏区域图像标识、其他区域图像标识,建立
心脏区域图像标识与图像存储路径之间的第一映射关系,以及其他区域图像标识与目标磁盘之间的第二映射关系,并将该第一映射关系和第二映射关系生成存储路径记录,并将存储路径记录存储至数据库中。
58.其中,阅片工作站上可以包括操作界面,当医生需要阅片调用该待处理医疗影像文件时,可以在阅片工作站的操作界面上点击心脏区域图像访问操作,从而当检测到心脏区域图像访问操作时,基于目标阅片工作站的图像存储路径获取心脏区域图像,即心脏区域图像作为重点兴趣图像可以直接从医生的阅片工作站的图像存储路径上打开。
59.当需要获取其他区域图像时,可以查询数据库的存储记录,并在操作界面上执行获取其他区域图像的点击操作,从而当检测到其他区域图像获取操作时,获取存储路径记录,并基于存储路径记录获取目标磁盘地址,访问目标磁盘地址获取其他区域图像,该其他区域图像包括非心脏区域的横断位灰度图像、后处理三维重建生成的彩色图像数据以及非横断位图像数据。
60.另外,计算机设备还可以记录待处理医疗影像文件每次的传输时间,并定期更新模型训练参数,以迭代更新网络传输时间预测模型。同时通过本技术中通过网络传输时间预测模型预测出当前时间内的传输时间最小的目标磁盘,该目标磁盘为低速磁盘位置,从而节省了后期定时将超过预设日期的高速磁盘的数据迁移至低速磁盘的处理,提高了存储归档的维护效率。
61.本技术实施例中提供的分布式存储方法,通过获取待处理医疗影像文件,并对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像,然后将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径,并基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘,然后将其他目标区域图像存储至目标磁盘,将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。该技术方案能够根据医生对影像文件的重点关注程度进行分类处理,以得到关注度较高的心脏区域图像和其他区域图像,并通过工作站预测模型对待处理医疗影像文件进行处理,从而精准地确定出当前时间内待处理医疗影像文件的推荐的存储位置并存储,使得医生阅片调用该影像文件时,直接访问医生电脑工作站下的存储路径,并对其他区域图像从可以服务器对应的存储位置下载,实现了降低存储服务器的网络压力,并负载均衡高速磁盘和低速磁盘的使用率,实现万幅图像阅片秒开的效果,有效缩减了医疗影像文件传输到医生阅片工作站的时间,有效提高工作效率。
62.在上述实施例的基础上,本技术实施例还提供了确定目标磁盘的具体实现方式,图3为基于待处理医疗影像文件和每个磁盘对应的络传输时间预测模型,确定目标磁盘方法的流程图,如图3所示,该方法包括:s201、获取每个磁盘的特征参数;特征参数包括时间属性特征和磁盘属性特征。
63.s202、将待处理医疗影像文件和特征参数输入每个网络时间预测模型进行预测处理,得到每个磁盘对应的网络传输时间。
64.s203、按照大小对所有网络传输时间的进行排序,确定最小的网络传输时间。
65.s204、将所有磁盘中最小的网络传输时间对应的磁盘作为目标磁盘。
66.具体地,对于每个磁盘,可以获取每个磁盘的特征参数,该特征参数包括时间属性
特征和磁盘属性特征,时间属性特征包括以下至少一项:高峰时段特征和非高峰时段特征;待处理医疗影像文件包括医学检查的属性特征,该属性特征包括以下至少一项:检查图像数量、检查图像文件总大小;磁盘属性特征包括以下至少一项:磁盘类型、磁盘使用率和磁盘读取速度。
67.其中,对于时间属性特征中的高峰时段特征可以是判断该天和前n天相似时间段的耗时平均值得到。该高峰时段特征是根据网络压力判断当天的当前时间段是否是高峰时段,以当前时间段判断网络流量的平均值,当前时间段可以是根据实际情况自定义设置,比如30分钟,可以确定当天和前n天的30分钟内的网络传输流量的平均值,并将平均值与设定的阈值进行大小比较,当平均值超过设定的阈值,即判定当天该时段为高峰时段,当未超过设定的预置时,则判断当天该时段为非高峰时段,n≥1。
68.上述医学检查的属性特征可以包括检查图像数量、检查图像文件总大小,其中的检查图像数量是一次训练心脏冠状动脉ct检查的所有图像总数,检查图像文件总大小是所有图像的文件存储大小。
69.上述磁盘类型可以分为高速磁盘和低速磁盘。当磁盘类型为高速磁盘时,医学检查的属性特征里的检查图像文件总大小是以非压缩格式的dicom文件的总大小计算的;当磁盘类型为低速磁盘时,医学检查的属性特征里的检查图像文件总大小是以无损压缩格式的dicom文件的总大小计算的。由于低速磁盘用于历史数据归档,以无损压缩模式存储会节省磁盘空间。
70.在获取到各个磁盘对应的特征参数后,可以将待处理医疗影像文件和特征参数输入每个网络时间预测模型进行预测处理,可以通过特征提取和分类处理,得到每个磁盘在预设时间段内对应的网络传输时间。其中该预设时间段可以是根据实际需求自定义设置的,例如为半小时或一小时。然后按照大小对所有网络传输时间的进行排序,确定最小的网络传输时间,并将所有磁盘中最小的网络传输时间对应的磁盘作为目标磁盘。
71.在其中一个实施例中,本技术还提供了网络时间预测模型的训练过程的具体实现方式,图4为网络时间预测模型的训练过程方法的流程图,请参见图4所示,该方法包括:s301、获取磁盘的历史特征数据和历史特征参数;历史特征参数包括历史时间属性特征和历史磁盘属性特征;历史特征数据标注有网络传输耗时标注结果。
72.s302、将历史时间属性特征、历史特征数据和历史磁盘属性特征输入初始神经网络模型进行处理,得到网络传输耗时预测结果。
73.s303、基于网络传输耗时预测结果和网络传输耗时标注结果,构建损失函数,按照损失函数最小化对初始神经网络模型进行迭代处理,得到网络传输时间预测模型。
74.具体地,可以获取磁盘的历史特征数据和历史特征参数,该历史特征数据包括历史医疗影像文件,该历史医疗影像文件中包括医学检查的属性特征,该历史特征参数包括历史时间属性特征和历史磁盘属性特征,其中,历史时间属性包括该磁盘在预设时间段的高峰时段和非高峰时段,该历史特征数据标注有预设时间段的网络传输耗时标注结果,然后将磁盘的历史时间属性特征、历史特征数据和历史磁盘属性特征输入初始神经网络模型进行特征提取和分类处理,得到网络传输耗时预测结果,基于网络传输耗时预测结果和网络传输耗时标注结果,构建损失函数,按照损失函数最小化对初始神经网络模型进行迭代处理,得到网络传输时间预测模型。
75.同理,当有n个磁盘时,可以采用上述方式训练n个网络传输时间预测模型,该n个网络传输时间预测模型用于预测n个磁盘的网络传输时间。其中,每个网络传输时间预测模型输入的历史特征参数中的历史磁盘属性特征不同。
76.示例性地,假设服务器可以包括3个磁盘,例如a盘、b盘和c盘,每个磁盘可以训练有对应的网络传输时间预测模型。其中,以a盘为例,在预测a盘对应的网络传输时间的过程中,可以获取a盘的特征参数,然后将a盘的特征参数和待处理医疗影像文件输入与该a盘对应的网络时间预测模型进行预测处理,得到a盘对应的网络传输时间,同理,采用上述方式得到b盘和c盘对应的网络传输时间。并按照时间大小对所有网络传输时间的进行排序,确定最小的网络传输时间,假设最小的网络传输时间为b盘,则将b盘作为目标磁盘。
77.本实施例中通过网络传输时间预测模型预测出目标磁盘,以及通过工作站预测模型预测出图像存储路径,能够将其他区域图像存储至目标磁盘,并将心脏区域图像存储至图像存储路径,使得可以对包含心脏区域的图像直接访问医生阅片工作站下的存储路径,对非心脏区域的图像从服务器对应的目标磁盘下载,降低pacs存储服务器的网络压力,并负载均衡高速磁盘和低速磁盘的使用率,实现万幅图像阅片秒开的效果,有效缩减了影像文件传输到医生电脑工作站的时间,有效提高工作效率。
78.应当注意,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
79.另一方面,图5为本技术实施例提供的一种分布式存储装置的结构示意图。该装置可以为服务器内的系统,如图5所示,该系统700包括:获取模块710,用于获取待处理医疗影像文件;分类模块720,用于对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;工作站预测模块730,用于将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径;目标磁盘确定模块740,用于基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;存储模块750,用于将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。
80.可选地,上述分类模块720,具体用于:对待处理医疗影像文件进行解析处理,获取检查描述信息、图像位数和图像坐标信息;基于检查描述信息、图像位数和图像坐标信息确定解析结果;当解析结果用于表征待处理医疗影像文件为心脏冠状动脉断层扫描检查和横断位切片图像的灰度数据时,将医疗影像文件通过心脏区域识别模型进行分类处理,得到心脏区域图像和其他区域图像;心脏区域识别模型是基于历史医疗影像文件和心脏区域标注结果进行训练得到的。
81.可选地,上述工作站预测模块730,具体用于:
将待处理医疗影像文件输入工作站预测模型中的特征提取模块进行特征提取,得到医疗影像特征;将医疗影像特征通过工作站预测模型中的分类模块进行分类处理,确定待处理医疗影像文件的目标阅片工作站;基于目标阅片工作站,确定目标阅片工作站的图像存储路径。
82.可选地,上述目标磁盘确定模块740,具体用于:获取每个磁盘的特征参数;特征参数包括时间属性特征和磁盘属性特征;将待处理医疗影像文件和特征参数输入每个网络时间预测模型进行预测处理,得到每个磁盘对应的网络传输时间;按照大小对所有网络传输时间的进行排序,确定最小的网络传输时间;将所有磁盘中最小的网络传输时间对应的磁盘作为目标磁盘。
83.可选的,获取磁盘的历史特征数据和历史特征参数;历史特征参数包括历史时间属性特征和历史磁盘属性特征;历史特征数据标注有网络传输耗时标注结果;将历史时间属性特征、历史特征数据和历史磁盘属性特征输入初始神经网络模型进行处理,得到网络传输耗时预测结果;基于网络传输耗时预测结果和网络传输耗时标注结果,构建损失函数,按照损失函数最小化对初始神经网络模型进行迭代处理,得到网络传输时间预测模型。
84.可选的,上述装置,还用于:当检测到心脏区域图像访问操作时,基于目标阅片工作站的图像存储路径获取心脏区域图像;心脏区域图像是待处理医疗影像文件中包括心脏区域的横断位灰度图像;当检测到其他区域图像获取操作时,获取存储路径记录,并基于存储路径记录获取目标磁盘地址,访问目标磁盘地址获取其他区域图像;其他区域图像是待处理医疗影像文件中除心脏区域图像之外的其他图像。
85.可选的,时间属性特征包括以下至少一项:高峰时段特征和非高峰时段特征;待处理医疗影像文件包括以下至少一项:检查图像数量、检查图像文件总大小;磁盘属性特征包括以下至少一项:磁盘类型、磁盘使用率和磁盘读取速度。
86.可以理解的是,本实施例的分布式存储装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,在此不再赘述。
87.另一方面,本技术实施例提供的计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如上述的分布式存储方法。
88.下面参考图6,图6为本技术实施例的终端设备的计算机系统的结构示意图。
89.如图6所示,计算机系统300包括中央处理单元(cpu)301,其可以根据存储在只读存储器(rom)302中的程序或者从存储部分303加载到随机访问存储器(ram)303中的程序而执行各种适当的动作和处理。在ram 303中,还存储有系统300操作所需的各种程序和数据。cpu 301、rom 302以及ram 303通过总线304彼此相连。输入/输出(i/o)接口305也连接至总线304。
90.以下部件连接至i/o接口305:包括键盘、鼠标等的输入部分306;包括诸如阴极射
线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分307;包括硬盘等的存储部分308;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分309。通信部分309经由诸如因特网的网络执行通信处理。驱动器310也根据需要连接至i/o接口305。可拆卸介质311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器310上,以便于从其上读出的计算机程序根据需要被安装入存储部分308。
91.特别地,根据本技术的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在机器可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分303从网络上被下载和安装,和/或从可拆卸介质311被安装。在该计算机程序被中央处理单元(cpu)301执行时,执行本技术的系统中限定的上述功能。
92.需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
93.附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
94.描述于本技术实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器,包括:获取模块、分类模块、工作站预测模块、目标磁盘确定模块和存储模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获
取模块还可以被描述为“用于获取待处理医疗影像文件”。
95.作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或者多个程序,当上述前述程序被一个或者一个以上的处理器用来执行描述于本技术的分布式存储方法:获取待处理医疗影像文件;对所述待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;将所述待处理医疗影像文件通过工作站预测模型进行处理,得到所述待处理医疗影像文件的目标阅片工作站的图像存储路径;基于所述待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;将所述其他区域图像存储至所述目标磁盘,并将所述心脏区域图像存储至所述目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。
96.综上,本技术实施例中提供的分布式存储方法、装置、设备及存储介质,通过获取待处理医疗影像文件,并对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像,然后将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径,并基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘,然后将其他目标区域图像存储至目标磁盘,将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。该技术方案能够根据医生对影像文件的重点关注程度进行分类处理,以得到关注度较高的心脏区域图像和其他区域图像,并通过工作站预测模型对待处理医疗影像文件进行处理,从而精准地确定出当前时间内待处理医疗影像文件的推荐的存储位置并存储,使得医生阅片调用该影像文件时,直接访问医生电脑工作站下的存储路径,并对其他区域图像从可以服务器对应的存储位置下载,实现了降低存储服务器的网络压力,并负载均衡高速磁盘和低速磁盘的使用率,实现万幅图像阅片秒开的效果,有效缩减了医疗影像文件传输到医生阅片工作站的时间,有效提高工作效率。
97.以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
技术特征:
1.一种分布式存储方法,其特征在于,包括:获取待处理医疗影像文件;对所述待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;将所述待处理医疗影像文件通过工作站预测模型进行处理,得到所述待处理医疗影像文件的目标阅片工作站的图像存储路径;基于所述待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;将所述其他区域图像存储至所述目标磁盘,并将所述心脏区域图像存储至所述目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。2.根据权利要求1所述的方法,其特征在于,对所述待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像,包括:对所述待处理医疗影像文件进行解析处理,获取检查描述信息、图像位数和图像坐标信息;基于所述检查描述信息、所述图像位数和所述图像坐标信息确定解析结果;当所述解析结果用于表征所述待处理医疗影像文件为心脏冠状动脉断层扫描检查和横断位切片图像的灰度数据时,将所述医疗影像文件通过心脏区域识别模型进行分类处理,得到心脏区域图像和其他区域图像;所述心脏区域识别模型是基于历史医疗影像文件和心脏区域标注结果进行训练得到的。3.根据权利要求1或2任一项所述的方法,其特征在于,将所述待处理医疗影像文件通过工作站预测模型进行处理,得到所述待处理医疗影像文件的阅片工作站的图像存储路径,包括:将所述待处理医疗影像文件输入所述工作站预测模型中的特征提取模块进行特征提取,得到医疗影像特征;将所述医疗影像特征通过所述工作站预测模型中的分类模块进行分类处理,确定所述待处理医疗影像文件的目标阅片工作站;基于所述目标阅片工作站,确定所述目标阅片工作站的图像存储路径。4.根据权利要求1所述的方法,其特征在于,基于所述待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘,包括:获取每个磁盘的特征参数;所述特征参数包括时间属性特征和磁盘属性特征;将所述待处理医疗影像文件和所述特征参数输入每个网络时间预测模型进行预测处理,得到每个所述磁盘对应的网络传输时间;按照大小对所有网络传输时间的进行排序,确定最小的网络传输时间;将所有磁盘中所述最小的网络传输时间对应的磁盘作为目标磁盘。5.根据权利要求4所述的方法,其特征在于,每个所述网络传输时间预测模型的训练过程包括如下步骤:获取所述磁盘的历史特征数据和历史特征参数;所述历史特征参数包括历史时间属性特征和历史磁盘属性特征;所述历史特征数据标注有网络传输耗时标注结果;将所述历史时间属性特征、所述历史特征数据和所述历史磁盘属性特征输入初始神经网络模型进行处理,得到网络传输耗时预测结果;
基于所述网络传输耗时预测结果和所述网络传输耗时标注结果,构建损失函数,按照损失函数最小化对所述初始神经网络模型进行迭代处理,得到网络传输时间预测模型。6.根据权利要求1所述的方法,其特征在于,在将所述其他区域图像存储至所述目标磁盘,并将所述心脏区域图像存储至所述目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库之后,所述方法还包括:当检测到心脏区域图像访问操作时,基于目标阅片工作站的图像存储路径获取所述心脏区域图像;所述心脏区域图像是所述待处理医疗影像文件中包括心脏区域的横断位灰度图像;当检测到其他区域图像获取操作时,获取存储路径记录,并基于所述存储路径记录获取目标磁盘地址,访问所述目标磁盘地址获取其他区域图像;所述其他区域图像是所述待处理医疗影像文件中除所述心脏区域图像之外的其他图像。7.根据权利要求4所述的方法,其特征在于,包括:所述时间属性特征包括以下至少一项:高峰时段特征和非高峰时段特征;所述待处理医疗影像文件包括以下至少一项:检查图像数量、检查图像文件总大小;所述磁盘属性特征包括以下至少一项:磁盘类型、磁盘使用率和磁盘读取速度。8.一种分布式存储装置,其特征在于,所述装置包括:获取模块,用于获取待处理医疗影像文件;分类模块,用于对所述待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;工作站预测模块,用于将所述待处理医疗影像文件通过工作站预测模型进行处理,得到所述待处理医疗影像文件的目标阅片工作站的图像存储路径;目标磁盘确定模块,用于基于所述待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;存储模块,用于将所述其他区域图像存储至所述目标磁盘,并将所述心脏区域图像存储至所述目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器用于执行所述程序时实现如权利要求1-7任一项所述的方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序用于实现如权利要求1-7任一项所述的方法。
技术总结
本申请公开了一种分布式存储方法、装置、设备及介质,该方法包括:获取待处理医疗影像文件;对待处理医疗影像文件进行分类处理,得到心脏区域图像和其他区域图像;将待处理医疗影像文件通过工作站预测模型进行处理,得到待处理医疗影像文件的目标阅片工作站的图像存储路径;基于待处理医疗影像文件和每个磁盘对应的网络传输时间预测模型,确定目标磁盘;将其他区域图像存储至目标磁盘,并将心脏区域图像存储至目标阅片工作站的图像存储路径,生成存储路径记录并存储至数据库。该方案能够直接访问图像存储路径以调用心脏区域图像,并可以从服务器对应的目标磁盘获取其他区域图像,降低存储服务器的网络压力,均衡了高速磁盘和低速磁盘的使用率。速磁盘的使用率。速磁盘的使用率。
技术研发人员:李达 石金龙 刘敏超 吕俊文 段振飞 张彦彬 岳天意
受保护的技术使用者:中国人民解放军总医院
技术研发日:2023.06.28
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/