信息处理装置、信息处理方法及存储介质与流程

未命名 08-02 阅读:155 评论:0


1.本发明涉及一种信息处理装置、信息处理方法及存储介质。


背景技术:

2.在专利文献1中公开了一种将相同数据记录在多个磁带上的技术。在该技术中,针对每个属性将多个数据汇总并记录在磁带上。
3.在专利文献2中公开了一种为了将数据有效地记录在磁带上,将尺寸为一定值以上的数据汇总并记录在磁带上的技术。
4.专利文献1:国际公开第2020/066389号
5.专利文献2:日本特开2009-093571号公报
6.在控制对磁带的数据记录的信息处理装置进行读取存储在磁盘装置等存储装置中的数据,并将该数据记录在磁带上的控制的情况下,优选减少对存储装置的负荷。然而,在专利文献1及专利文献2中记载的技术中,在向磁带记录数据时对存储有数据的存储装置的负荷减少的观点上,存在改善的空间。


技术实现要素:

7.本发明是鉴于以上情况完成的,其目的在于,提供一种信息处理装置、信息处理方法及存储介质,该信息处理装置能够减少在向磁带记录数据时对存储有数据的存储装置的负荷。
8.本发明的信息处理装置具备至少一个处理器,且进行将相同数据记录在多个磁带上的控制,其中,处理器进行如下处理:读取多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据定义信息生成与磁带的数量相同数量的汇总了多个数据的存档数据,进行将所生成的多个存档数据以1对1的方式记录在多个磁带上的控制。
9.另外,在本发明的信息处理装置中,定义信息包含表示存储有尺寸为阈值以上的数据的存储装置上的存储位置的信息,处理器可以在生成存档数据的情况下,根据表示存储装置上的存储位置的信息从存储装置读取尺寸为阈值以上的数据。
10.并且,在本发明的信息处理装置中,定义信息包含尺寸小于阈值的数据,处理器可以在生成存档数据的情况下,从定义信息中读取尺寸小于阈值的数据。
11.并且,在本发明的信息处理装置中,处理器可以并行执行生成与磁带的数量相同数量的存档数据的处理。
12.并且,在本发明的信息处理装置中,存档数据是包含数据和与该数据相关的元数据的多个对象汇总而成的数据,定义信息包含存档数据中包含的多个对象各自的元数据、和表示存储有与元数据对应的数据的存储装置上的存储位置的信息,处理器可以在生成存档数据的情况下,根据表示存储装置上的存储位置的信息从存储装置读取数据,从定义信息中读取元数据。
13.并且,本发明的信息处理方法由具备至少一个处理器且进行将相同数据记录在多
个磁带上的控制的信息处理装置的处理器执行,所述信息处理方法包括如下步骤:读取多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据定义信息生成与磁带的数量相同数量的汇总了多个数据的存档数据,进行将所生成的多个存档数据以1对1的方式记录在多个磁带上的控制。
14.并且,本发明的信息处理程序用于使具备至少一个处理器且进行将相同数据记录在多个磁带上的控制的信息处理装置的处理器执行如下处理:读取多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据定义信息生成与磁带的数量相同数量的汇总了多个数据的存档数据,进行将所生成的多个存档数据以1对1的方式记录在多个磁带上的控制。
15.发明效果
16.根据本发明,能够减少在向磁带记录数据时对存储有数据的存储装置的负荷。
附图说明
17.图1是表示信息处理系统的结构的一例的框图。
18.图2是用于说明对象的图。
19.图3是用于说明压缩对象的图。
20.图4是用于说明对象被复用并记录在多个磁带上的图。
21.图5是表示信息处理装置的硬件结构的一例的框图。
22.图6是表示信息处理装置的功能结构的一例的框图。
23.图7是表示定义信息的一例的图。
24.图8是用于说明压缩对象的生成处理的图。
25.图9是用于说明将多个压缩对象记录在多个磁带上的处理的图。
26.图10是表示对象记录处理的一例的流程图。
27.图11是用于说明比较例所涉及的对象记录处理的图。
28.图12是用于说明实施方式所涉及的对象记录处理的图。
具体实施方式
29.以下,参考附图,对用于实施本发明的技术的方式例详细地进行说明。
30.首先,参考图1,对本实施方式所涉及的信息处理系统10的结构进行说明。如图1所示,信息处理系统10包括信息处理装置12及磁带库14。作为信息处理装置12的例子,可举出服务器计算机等。
31.磁带库14具备多个插槽(省略图示)及多个磁带驱动器18,并且在各插槽中存储有作为记录介质的一例的磁带t。各磁带驱动器18与信息处理装置12连接。磁带驱动器18通过信息处理装置12的控制,对磁带t进行数据的写入或读取。作为磁带t的例子,可举出lto(linear tape-open:线性磁带开放协议)磁带。
32.在由信息处理装置12对磁带t进行数据的写入或读取的情况下,写入或读取对象的磁带t从插槽加载到规定的磁带驱动器18。当对加载到磁带驱动器18的磁带t的数据的写入或读取完成时,磁带t从磁带驱动器18卸载到原来存储的插槽中。
33.在本实施方式中,作为一例,如图2所示,作为处理记录在磁带t上的数据的单位,
对适用包含文档数据及图像数据等用户作为保存对象的数据和与该数据相关的元数据的对象的方式例进行说明。在图2的例子中,将元数据表述为“元”。另外,处理该对象的存储系统被称为对象存储系统。元数据例如包含对象键等对象的识别信息、对象名、数据的尺寸及时间戳等属性信息。另外,将对象记录在磁带t上时的数据及元数据的记录顺序没有特别限定,可以是元数据及数据的顺序,也可以是数据及元数据的顺序。
34.并且,在本实施方式中,作为一例,如图3所示,以按照预先确定的规则(以下,称为“打包规则”)汇总了多个对象的对象(以下,称为“压缩对象”)单位将对象记录在磁带t上。这是为了减少信息处理装置12向磁带t记录对象时向磁带驱动器18发出记录指示的命令所引起的开销(overhead)等。对象是要记录在磁带t上的数据的一例,压缩对象是汇总了多个数据的存档数据的一例。图3的“obj”表示对象。另外,在图3中示出了在1个压缩对象中包含4个对象的例子,但并不限定于此。1个压缩对象中可以包含3个以下的对象,也可以包含5个以上的对象。并且,压缩对象中包含的对象的个数可以不均匀。
35.作为打包规则的例子,可举出将包含相同扩展名的数据的多个对象汇总到相同压缩对象中,或将同时读取的可能性高的多个对象汇总到相同压缩对象中的规则。并且,作为打包规则的例子,可举出以1个压缩对象的尺寸成为预先确定的下限值以上且小于上限值的方式将多个对象汇总到1个压缩对象中的规则。并且,作为打包规则的例子,可举出以1个压缩对象中包含的对象的数量成为预先确定的下限值以上且小于上限值的方式将多个对象汇总到1个压缩对象中的规则。并且,也可以组合多个打包规则。
36.并且,在本实施方式中,对象被冗余地记录在多个磁带t上。具体而言,作为一例,如图4所示,相同对象被复用并记录在多个磁带t上。在本实施方式中,如图4所示,以将相同对象记录在2个磁带t上、即多重度为2的情况为例进行了说明,但多重度也可以是3以上。
37.2个磁带t中,第1磁带t用作主数据用磁带t,第2磁带t用作子数据用磁带t。通常,从主数据用磁带t读取对象。在无法从主数据用磁带t读取对象的情况下,从子数据用磁带t读取对象。
38.接着,参考图5,对本实施方式所涉及的信息处理装置12的硬件结构进行说明。如图5所示,信息处理装置12包括cpu(central processing unit:中央处理器)20、作为临时存储区域的存储器21及非易失性存储部22。并且,信息处理装置12包括液晶显示器等显示器23、键盘和鼠标等输入装置24、与网络连接的网络i/f(interface:接口)25、及连接各磁带驱动器18的外部i/f26。cpu20、存储器21、存储部22、显示器23、输入装置24、网络i/f25及外部i/f26与总线27连接。cpu20是处理器的一例。
39.存储部22通过hdd(hard disk drive:硬盘驱动器)、ssd(solid stat e drive:固态驱动器)或闪存等来实现。在作为存储介质的存储部22中存储有信息处理程序30。cpu20从存储部22读出信息处理程序30后,将其展开到存储器21中,并执行展开的信息处理程序30。
40.然而,本实施方式所涉及的信息处理装置12接收从用户终端等外部装置发送的数据及元数据。在从该外部装置发送数据时,例如使用由信息处理系统10提供的http(hypertext transfer protocol:超文本传输协议)api(appli cation programming interface:应用程序编程接口)。在该情况下,例如,用户要发送的数据包含在http的body部分中,与该数据相关的元数据包含在http的header部分中。信息处理装置12将接收到的
数据及元数据建立对应关联之后,分别将数据及元数据存储在存储部22中。并且,信息处理装置12具有进行如下控制的功能:将汇总了包含存储在存储部22中的多组数据及元数据的多个对象的压缩对象复用并记录在多个(在本实施方式中为2个)磁带t上。
41.接着,参考图6,对本实施方式所涉及的信息处理装置12的功能结构进行说明。如图6所示,信息处理装置12包括第1生成部40、读取部42、第2生成部44及控制部46。cpu20通过执行信息处理程序30而作为第1生成部40、读取部42、第2生成部44及控制部46发挥功能。
42.第1生成部40生成多个磁带t中共用的定义信息、即定义了压缩对象中包含的多个对象的定义信息。具体而言,首先,第1生成部40从存储在存储部22中的对象组中确定符合所设定的打包规则的多个对象。接着,第1生成部40生成包含所确定的多个对象各自的元数据的定义信息。此时,对于所确定的多个对象各自的数据,第1生成部40将表示作为存储有该数据的存储装置的一例的存储部22上的存储位置的信息(以下,称为“存储路径”)包含在定义信息中。即,对应于1个压缩对象,生成定义了该压缩对象中包含的各对象的1个定义信息。并且,第1生成部40进行将所生成的定义信息存储在存储部22中的控制。
43.图7中示出由第1生成部40生成的定义信息的一例。如图7所示,本实施方式所涉及的定义信息包含压缩对象中包含的多个对象各自的元数据和与该元数据对应的数据的存储路径。在图7的例子中,存储路径以文件系统中的绝对路径的格式表示。并且,在图7的例子中,元数据在大括号({})内以文本格式表示。另外,元数据可以以二进制格式表示。
44.读取部42读取由第1生成部40生成且存储在存储部22中的定义信息。
45.第2生成部44根据由读取部42读取的定义信息,生成与磁带t的数量相同数量(即,与多重度相同的数量)的汇总了多个对象的压缩对象。作为一例,如图8所示,第2生成部44在生成压缩对象的情况下,根据存储路径从存储部22读取数据,从定义信息中读取元数据。在本实施方式中,第2生成部44并行执行生成与磁带t的数量相同数量的压缩对象的处理。具体而言,第2生成部44执行以与磁带t的数量相同数量的线程分别生成压缩对象的处理。
46.作为一例,如图9所示,控制部46进行将由第2生成部44生成的多个压缩对象以1对1的方式记录在多个磁带t上的控制。在本实施方式中,控制部46并行执行将多个压缩对象记录在多个磁带t上的控制。具体而言,控制部46执行以与磁带t的数量相同数量的线程分别将压缩对象记录在磁带t上的控制。作为该控制,例如,控制部46执行将压缩对象及该压缩对象的记录指示发送到磁带驱动器18的处理。
47.接着,参考图10,对本实施方式所涉及的信息处理装置12的作用进行说明。通过cpu20执行信息处理程序30,执行图10所示的对象记录处理。例如,当由用户输入执行指示时,及当存储在存储部22中的数据尺寸的合计值成为一定值以上等时执行图10所示的对象记录处理。
48.在图10的步骤s10中,如上所述,第1生成部40生成多个磁带t中共用的定义信息、即定义了压缩对象中包含的多个对象的定义信息。并且,第1生成部40进行将所生成的定义信息存储在存储部22中的控制。
49.在步骤s12中,读取在步骤s10中存储在存储部22中的定义信息。在步骤s14中,如上所述,第2生成部44根据在步骤s12中读取的定义信息生成与磁带t的数量相同数量的汇总了多个对象的压缩对象。在步骤s16中,如上所述,控制部46进行将在步骤s14中生成的多个压缩对象以1对1的方式记录在多个磁带t上的控制。当步骤s16的处理结束时,对象记录
处理结束。
50.作为一例,如图11所示,在不使用定义信息的情况下,读取存储在存储部22中的多个对象,由所读取的多个对象生成多个压缩对象。并且,在该情况下,所生成的多个压缩对象存储在存储部22中,读取存储在存储部22中的多个压缩对象,所读取的多个压缩对象以1对1的方式记录在多个磁带t上。
51.作为一例,如图12所示,在本实施方式中,由于使用共用的定义信息,因此读取存储在存储部22中的多个对象,由所读取的多个对象生成多个压缩对象。并且,在该情况下,所生成的多个压缩对象以1对1的方式记录在多个磁带t上。因此,根据本实施方式,能够减少在向磁带t记录对象时对存储有对象的存储部22的负荷。
52.并且,在本实施方式中,并行执行生成多个压缩对象的处理。例如,在多个线程中分别按照打包规则生成压缩对象的情况下,根据各个线程的执行定时的差异,有时符合打包规则的对象不同。在该情况下,分别记录在多个磁带t上的压缩对象中包含的对象会不同。与此相对,在本实施方式中,根据按照打包规则生成的共用的定义信息来生成压缩对象。因此,能够使分别记录在多个磁带t上的压缩对象中包含的对象相同。
53.并且,在本实施方式中,将比较小的尺寸的元数据包含在定义信息中。在比较小的尺寸的数据中,从存储部22读取数据时的文件打开、文件读取及文件关闭中,文件打开及文件关闭的负荷比率变高。在本实施方式中,由于将比较小的尺寸的元数据包含在定义信息中,因此若从存储部22读取定义信息,则能够从该定义信息中提取元数据。因此,在该情况下,由于文件打开及文件关闭的次数为从存储部22读取定义信息时的1次,因此与从存储部22分别读取元数据的情况相比,能够减少对存储部22的负荷。
54.另外,在上述实施方式中,第1生成部40在生成定义信息时,也可以将尺寸为阈值以上的数据的存储路径包含在定义信息中,将尺寸小于阈值的数据包含在定义信息中。此时的阈值例如设定为在元数据的尺寸的上限值上加了余量的值等比较小的值。并且,在该情况下,第2生成部44在生成压缩对象的情况下,根据定义信息中包含的存储路径从存储部22读取尺寸为阈值以上的数据,从定义信息中读取尺寸小于阈值的数据。
55.并且,在上述实施方式中,对元数据包含在定义信息中的情况进行了说明,但并不限定于此。例如,关于元数据也与数据同样地,元数据的存储路径可以包含在定义信息中。
56.并且,在上述实施方式中,对数据的存储路径包含在定义信息中的情况进行了说明,但并不限定于此。例如,关于数据也与元数据同样地,数据可以包含在定义信息中。
57.并且,在上述实施方式中,对将发明的技术适用于对象存储系统的情况进行了说明,但并不限定于此。可以将发明的技术适用于以文件单位处理数据的文件存储系统。
58.并且,在上述实施方式中,例如,作为执行第1生成部40、读取部42、第2生成部44及控制部46之类的各种处理的处理部(processing unit)的硬件结构,能够使用以下所示的各种处理器(processor)。如上所述,上述各种处理器中,除了执行软件(程序)而作为各种处理部发挥功能的通用的处理器即cpu以外,还包括fpga(field programmable gate array:现场可编程门阵列)等在制造后能够变更电路结构的处理器即可编程逻辑器件(programmab le logic device:pld)、asic(application specific integrated circui t:专用集成电路)等为了执行特定的处理而进行专用设计的具有电路结构的处理器即专用电路等。
59.1个处理部可以由这些各种处理器中的1个构成,也可以由相同种类或不同种类的两个以上的处理器的组合(例如,多个fpga的组合、或cpu和fpga的组合)构成。并且,也可以由1个处理器构成多个处理部。
60.作为由1个处理器构成多个处理部的例子,第一,有如下方式:如以客户端及服务器等计算机为代表那样,由1个以上的cpu和软件的组合构成1个处理器,该处理器作为多个处理部发挥功能。第二,有如下方式:如以片上系统(system on chip:soc)等为代表那样,使用由1个ic(integrated circui t:集成电路)芯片实现包括多个处理部的系统整体的功能的处理器。如此,各种处理部使用1个以上的上述各种处理器作为硬件结构而构成。
61.而且,作为这些各种处理器的硬件结构,更具体而言,能够使用组合了半导体元件等电路元件的电路(circuitry)。
62.并且,在上述实施方式中,对信息处理程序30预先存储(安装)在存储部22中的方式进行了说明,但并不限定于此。信息处理程序30也可以以记录在cd-rom(compact disc read only memory:光盘只读存储器)、dvd-rom(dig ital versatile disc read only memory:数字多功能光盘只读存储器)、及usb(universal serial bus:通用串行总线)存储器等记录介质中的形式提供。并且,信息处理程序30也可以经由网络从外部装置下载。
63.符号说明
64.10-信息处理系统,12-信息处理装置,14-磁带库,18-磁带驱动器,20-cpu,21-存储器,22-存储部,23-显示器,24-输入装置,25-网络i/f,26-外部i/f,27-总线,30-信息处理程序,40-第1生成部,42-读取部,44-第2生成部,46-控制部,t-磁带。

技术特征:
1.一种信息处理装置,其具备至少一个处理器,且进行将相同数据记录在多个磁带上的控制,其中,所述处理器进行如下处理:读取所述多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据所述定义信息生成与所述磁带的数量相同数量的汇总了所述多个数据的所述存档数据,进行将所生成的多个所述存档数据以1对1的方式记录在所述多个磁带上的控制。2.根据权利要求1所述的信息处理装置,其中,所述定义信息包含表示存储有尺寸为阈值以上的数据的存储装置上的存储位置的信息,所述处理器在生成所述存档数据的情况下,根据所述信息从所述存储装置读取尺寸为所述阈值以上的数据。3.根据权利要求2所述的信息处理装置,其中,所述定义信息包含尺寸小于所述阈值的数据,所述处理器在生成所述存档数据的情况下,从所述定义信息中读取尺寸小于所述阈值的数据。4.根据权利要求1至3中任一项所述的信息处理装置,其中,所述处理器并行执行生成与所述磁带的数量相同数量的所述存档数据的处理。5.根据权利要求1至3中任一项所述的信息处理装置,其中,所述存档数据是包含数据和与该数据相关的元数据的多个对象汇总而成的数据,所述定义信息包含所述存档数据中包含的多个对象各自的所述元数据、和表示存储有与所述元数据对应的数据的存储装置上的存储位置的信息,所述处理器在生成所述存档数据的情况下,根据所述信息从所述存储装置读取所述数据,从所述定义信息中读取所述元数据。6.根据权利要求4所述的信息处理装置,其中,所述存档数据是包含数据和与该数据相关的元数据的多个对象汇总而成的数据,所述定义信息包含所述存档数据中包含的多个对象各自的所述元数据、和表示存储有与所述元数据对应的数据的存储装置上的存储位置的信息,所述处理器在生成所述存档数据的情况下,根据所述信息从所述存储装置读取所述数据,从所述定义信息中读取所述元数据。7.一种信息处理方法,其由具备至少一个处理器且进行将相同数据记录在多个磁带上的控制的信息处理装置的所述处理器执行,所述信息处理方法包括如下步骤:读取所述多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据所述定义信息生成与所述磁带的数量相同数量的汇总了所述多个数据的所述存档数据,进行将所生成的多个所述存档数据以1对1的方式记录在所述多个磁带上的控制。8.一种存储有信息处理程序的计算机可读取的存储介质,所述信息处理程序用于使具
备至少一个处理器且进行将相同数据记录在多个磁带上的控制的信息处理装置的所述处理器执行如下处理:读取所述多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据所述定义信息生成与所述磁带的数量相同数量的汇总了所述多个数据的所述存档数据,进行将所生成的多个所述存档数据以1对1的方式记录在所述多个磁带上的控制。

技术总结
本发明提供一种信息处理装置、信息处理方法及存储介质,该信息处理装置能够减少在向磁带记录数据时对存储有数据的存储装置的负荷。信息处理装置读取多个磁带中共用的定义信息、即定义了存档数据中包含的多个数据的定义信息,根据定义信息生成与磁带的数量相同数量的汇总了多个数据的存档数据,进行将所生成的多个存档数据以1对1的方式记录在多个磁带上的控制。控制。控制。


技术研发人员:大石豊 近藤理贵 大塚美咲 增田优子
受保护的技术使用者:富士胶片株式会社
技术研发日:2023.01.18
技术公布日:2023/7/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐