计算机可读记录介质、特征量计算方法和特征量计算装置与流程
未命名
08-01
阅读:131
评论:0

1.实施方式涉及存储特征量计算程序的非暂态计算机可读存储介质、特征量计算方法和特征量计算装置。
背景技术:
2.近来,在药物发现领域,机器学习作为用于搜索候选分子的方法已经引起了关注,并且正在考虑基于分子结构指定可以由机器学习处理的特征量的技术。
3.作为示例,例如,已知使用指纹作为特征量的方法、通过将分子序列视为具有起点和终点的结构来表示特征量的方法等。
4.国际专利申请的日本国家公布第2012-509848号和国际专利申请的日本国家公布第2020-517290号作为相关技术公开。
5.tajimi等人的bmc bioinformatics 2018,19(增刊19):527、x.yang等人的computational and structural biotechnology journal 18(2020)153-161、以及carhart等人的j.chem.inf.,1985也作为相关技术公开。
技术实现要素:
6.技术问题
7.在分子的部分结构具有特定序列的情况下、在分子包括环状结构等的情况下,上面所描述的常规技术不足以高精度地将分子结构反映到特征量。
8.在一个方面,本实施方式的目的是高精度地将分子结构反映到特征量。
9.问题的解决方案
10.根据实施方式的一个方面,存在一种存储特征量计算程序的非暂态计算机可读记录介质,该特征量计算程序用于使计算机执行处理。在示例中,所述处理包括:接收结构指定信息,该结构指定信息指定关于环状分子(cyclic molecule)的多个原子团中的每个原子团的类型和多个原子团的序列,其中在该环状分子中,被分类成多个类型的多个原子团被循环按序排列;在多个类型中指定可选的第一类型和可选的第二类型;基于结构指定信息,从多个原子团中指定被分类为第一类型的一个或多个第一原子团和被分类为第二类型的一个或多个第二原子团;以及基于结构指定信息,计算第一原子团和第二原子团的对(pairs)的数目,在所述对中,第一原子团与第二原子团之间在序列中的相互距离是预定距离。
11.发明的有益效果
12.高精度地将分子结构的特征反映到特征量。
附图说明
13.图1是示出特征量计算装置的示例的图;
14.图2(即,图2a和图2b)是用于示出第一实施方式的特征量的图;
15.图3是示出特征量计算装置的硬件配置的示例的图;
16.图4是用于示出第一实施方式的特征量计算单元的功能的图;
17.图5(即,图5a和图5b)是用于示出结构指定信息的图;
18.图6是用于示出第一实施方式的特征量计算装置的处理的流程图;
19.图7a是用于示出使用特征量的处理的第一图;
20.图7b是用于示出使用特征量的处理的第二图;
21.图7c是用于示出使用特征量的处理的第三图;
22.图8a至图8c是用于示出第二实施方式的特征量的图;
23.图9是用于示出第二实施方式的特征量计算单元的功能的图;以及
24.图10是用于示出第二实施方式的特征量计算装置的处理的流程图。
具体实施方式
25.(第一实施方式)
26.在下文中,参照附图描述实施方式。图1是示出特征量计算装置的示例的图。
27.在该实施方式的特征量计算装置100中安装特征量计算程序,并且通过执行特征量计算程序来实现特征量计算单元110的功能。稍后详细描述特征量计算单元110。
28.该实施方式的特征量计算装置100例如经由网络等连接至信息处理装置200等。
29.当从信息处理装置200输入指定分子结构的结构指定信息时,该实施方式的特征量计算装置100通过特征量计算单元110使用结构指定信息来计算指示分子结构的特征量,并将该特征量输出至信息处理装置200。
30.结构指定信息10是指定其中多个原子团被循环按序排列的分子的结构的信息。稍后详细描述结构指定信息10。
31.当输入结构指定信息10时,特征量计算装置100针对结构指定信息10中包括的多个原子团中的每个原子团获取指示相距n个原子团排列的特定类型的原子团的数目的信息,并将该信息输出至信息处理装置200。
32.信息处理装置200可以包括学习单元,并且可以使用从特征量计算装置100输出的特征量来执行机器学习。例如,该实施方式的特征量30可以用于预测药物发现等所需的物质量(substance amount)。
33.在该实施方式中,通过以这种方式表达特征量,可以将特定原子团被包括在分子中的事实和多个原子团被循环按序排列的事实反映到分子的特征量。因此,根据该实施方式,可以将分子结构高精度地反映到特征量。
34.注意,在该实施方式中,原子团指示分子中的部分结构。例如,该实施方式的部分结构(原子团)是氨基酸。此外,该实施方式中的分子指示环肽。例如,环肽是其中多个氨基酸被循环按序排列的分子。
35.氨基酸的类型包括例如天冬氨酸、亮氨酸、赖氨酸等。在以下描述中,天冬氨酸可以被表示为“asp”,亮氨酸被表示为“leu”,并且赖氨酸被表示为“lys”。
36.注意,在图1中的示例中,假定从信息处理装置200输入结构指定信息10,但这并不限于此。可以将结构指定信息10直接输入至特征量计算装置100。
37.此外,在图1中的示例中,假定特征量30被输出至信息处理装置200,但这并不限于
此。特征量30可以被输出至除信息处理装置200之外的装置。此外,特征量30的输出目的地可以是例如使用特征量30执行机器学习的学习装置。
38.在下文中,参照图2描述该实施方式的特征量。图2(即,图2a和图2b)是用于示出第一实施方式的特征量的图。图2a示出了环肽的示例,并且图2b示出了特征量30的示例。
39.在该实施方式中,对于作为环肽20中包括的每个原子团的每个氨基酸,对某个氨基酸和在环肽20的序列中位于距该氨基酸第n个位置的氨基酸的对(pairs)的数目进行计数。然后,在该实施方式中,使以下矩阵为特征量,在该矩阵中使n的值为行、使指示对中包括的氨基酸的类型的信息为列并且使对的数目为分量。
40.这里,在本说明书中,n的值被称为环肽20中的氨基酸之间的“距离”。在这种情况下,该实施方式的特征量30可以说是以下信息,该信息包括:对于环肽20中的每个氨基酸,指示某个氨基酸与另一氨基酸之间的距离的n的值,以及排列在距某个氨基酸距离为n处的其他氨基酸的数目。例如,该信息可以说是指示环肽20中包括的氨基酸的序列中的每个氨基酸与另一氨基酸之间的位置关系的信息。
41.此外,特征量30包括指示某个氨基酸的类型和位于距该某个氨基酸第n个位置的另一氨基酸的类型的信息。
42.例如,该实施方式的特征量30可以说是指示环肽20中包括的氨基酸的序列中的每个氨基酸与另一氨基酸之间的位置关系的信息以及指示每个氨基酸的类型和另一氨基酸的类型的信息。
43.注意,该实施方式中的另一氨基酸可以是与某个氨基酸相同类型的氨基酸,或可以是不同类型的氨基酸。
44.图2a所示的环肽20具有其中亮氨酸(leu)、天冬氨酸(asp)和赖氨酸(lys)被循环按序排列的结构。
45.因此,在该实施方式中,对亮氨酸和位于距亮氨酸第n个位置的亮氨酸的对(leu-leu)的数目、亮氨酸和位于距亮氨酸第n个位置的天冬氨酸的对(leu-asp)的数目、以及亮氨酸和位于距亮氨酸第n个位置的赖氨酸的对(leu-lys)的数目中的每个数目进行计数。
46.例如,在该实施方式中,对排列在距亮氨酸距离为n处的位置的其他氨基酸的数目进行计数。这里,其他氨基酸包括亮氨酸、天冬氨酸和赖氨酸。
47.此外,在该实施方式中,对天冬氨酸和位于距天冬氨酸第n个位置的天冬氨酸的对(asp-asp)的数目、赖氨酸和位于距赖氨酸第n个位置的赖氨酸的对(lys-lys)的数目、以及赖氨酸和位于距赖氨酸第n个位置的天冬氨酸的对(lys-asp)的数目进行计数。
48.例如,在该实施方式中,对位于距天冬氨酸距离为n处的位置的其他氨基酸的数目和位于距赖氨酸距离为n处的位置的其他氨基酸的数目进行计数。这里,其他氨基酸包括亮氨酸、天冬氨酸和赖氨酸。
49.例如,在图2所示的环肽20中,只有一个对21作为n=1的“leu-leu”对。例如,在环肽20中,关于某些亮氨酸,排列在距参考亮氨酸的第一个位置的亮氨酸的总数是1。
50.此外,在环肽20中,有三个对22、23和24作为n=1的“leu-lys”对。例如,在环肽20中,关于某些亮氨酸,排列在距参考亮氨酸的第一个位置的赖氨酸的总数是3。
51.类似地,在环肽20中,有一个n=2的“leu-leu”对。例如,在环肽20中,关于某些亮氨酸,排列在距参考亮氨酸的第二个位置的亮氨酸的总数是1。
52.此外,在环肽20中,有一个n=3的“leu-leu”对。例如,在环肽20中,关于某些亮氨酸,排列在距参考亮氨酸的第三个位置的亮氨酸的总数是1。
53.以这种方式,在该实施方式中,在环肽20中包括的多个氨基酸中指定氨基酸类型的可能组合(对)。然后,在该实施方式中,使以下矩阵为特征量30,在该矩阵中,所指定的对中的氨基酸的类型、对中包括的氨基酸之间的距离和对于每个距离的对的数目彼此相关联。
54.因此,根据该实施方式,可以创建专门用于环肽的特征量,并且可以高精度地将环肽的结构的特征反映到该特征量。因此,根据该实施方式,可以通过使用该特征量的机器学习来促进药物发现的加速。
55.在下文中,参照图3描述该实施方式的特征量计算装置100的硬件配置。图3是示出特征量计算装置的硬件配置的示例的图。
56.该实施方式的特征量计算装置100是计算机,该计算机包括经由总线b1彼此相互连接的输入装置11、输出装置12、驱动装置13、辅助存储装置14、存储器装置15、算术处理装置16和接口装置17。
57.输入装置11是用于输入各种类型的信息的装置,并且由例如键盘、指向装置等来实现。输出装置12用于输出各种类型的信息,并且由例如显示器等来实现。接口装置17包括局域网(lan)卡等,并且用于连接至网络。
58.实现特征量计算装置100中包括的特征量计算单元110的特征量计算程序是控制特征量计算装置100的各种程序的至少一部分。特征量计算程序通过例如记录介质18的分发、从网络下载等来提供。作为记录特征量计算程序的记录介质18,可以使用各种类型的记录介质例如光学地、电学地或磁性地记录信息的记录介质,例如致密盘只读存储器(cd-rom)、软盘和磁光盘、电学地记录信息的半导体存储器(例如,rom和闪存等)。
59.当记录特征量计算程序的记录介质18被设置在驱动装置13中时,经由驱动装置13将记录在记录介质18中的特征量计算程序从记录介质18安装在辅助存储装置14中。经由接口装置17将从网络下载的特征量计算程序安装在辅助存储装置14中。
60.辅助存储装置14存储安装在特征量计算装置100中的特征量计算程序,并且还存储特征量计算装置100所需的各种文件、数据等。存储器装置15在特征量计算装置100启动时从辅助存储装置14读取特征量计算程序,并存储该特征量计算程序。然后,算术处理装置16根据存储在存储器装置15中的特征量计算程序来实现稍后将描述的各种类型的处理。
61.接下来,参照图4描述该实施方式的特征量计算单元110的功能。图4是用于示出第一实施方式的特征量计算单元的功能的图。
62.该实施方式的特征量计算单元110包括输入接收单元111、对指定单元(a pair specification unit)112、对数计数单元(a pair number count unit)113、特征量获取单元114和输出单元115。
63.输入接收单元111接收对特征量计算装置100的各种输入。例如,输入接收单元111接收输入至特征量计算装置100的结构指定信息10。
64.对指定单元112参考结构指定信息10指定其中氨基酸在指定距离处的对。
65.对数计数单元113对环肽中包括的指定的对的数目进行计数。
66.特征量获取单元114获取特征量,在该特征量中将指定的对、对中包括的氨基酸之
间的距离以及由对数计数单元113计数的数目表示为矩阵。
67.输出单元115将由特征量获取单元114获取的特征量输出至外部装置,例如信息处理装置200。
68.接下来,参照图5描述该实施方式的结构指定信息10。图5(即,图5a和图5b)是用于示出结构指定信息的图。图5a示出了环肽的示例,并且图5b示出了指定环肽结构的结构指定信息的示例。
69.该实施方式的结构指定信息10是包括环肽20中包括的氨基酸的类型和与某个氨基酸相邻的氨基酸的类型的信息。
70.例如,如图5a所示,环肽20包括三种类型的氨基酸,即天冬氨酸、亮氨酸和赖氨酸。此外,环肽20包括六个氨基酸。
71.结构指定信息10是指示环肽20中包括的氨基酸的序列的矩阵,并且每个列和每个行中的分量指示由每个列和行指示的氨基酸是否彼此相邻。
72.在该实施方式中,在结构指定信息10中,在每个列和每个行中的分量为“0”的情况下,这指示由每个列和每个行指示的氨基酸彼此不相邻(距离n=2或更长),而在每个列和每个行中的分量为“1”的情况下,这指示由每个列和每个行指示的氨基酸彼此相邻(距离n=1)。
73.例如,在图5b中的结构指定信息10中,第一列和第二行中的分量以及第一列和第六行中的分量为“1”,并且应当理解,在环肽20中天冬氨酸与亮氨酸和赖氨酸相邻。此外,在结构指定信息10中,第二列和第二行中的分量以及第二列和第三行中的分量为“1”,并且应当理解,在环肽20中与天冬氨酸相邻排列的亮氨酸也与赖氨酸相邻。
74.该实施方式的结构指定信息10可以由例如信息处理装置200的用户等预先创建,并被输入至特征量计算装置100。
75.接下来,参照图6描述该实施方式的特征量计算装置100的处理。图6是用于示出第一实施方式的特征量计算装置的处理的流程图。
76.该实施方式的特征量计算装置100的特征量计算单元110通过输入接收单元111接收结构指定信息10的输入(步骤s601)。随后,特征量计算装置100通过对指定单元112从结构指定信息10中读取氨基酸的序列的顺序(步骤s602)。
77.随后,对指定单元112从由结构指定信息10指示的氨基酸的序列中指定特定类型的氨基酸(第一原子团),该特定类型的氨基酸(第一原子团)是对中包括的氨基酸之一(步骤s603)。
78.在以下描述中,在步骤s603处指定的氨基酸的类型有时用“a”表示,并且在步骤s603处指定的类型的氨基酸有时用氨基酸a表示。
79.随后,对指定单元112将指示氨基酸a与和氨基酸a配对的氨基酸之间的距离的n的值设置为“1”(步骤s604)。
80.随后,对指定单元112从由结构指定信息10指示的氨基酸的序列中指定与氨基酸a相距n个氨基酸排列的氨基酸(第二原子团)(步骤s605)。
81.在以下描述中,在步骤s605处指定的氨基酸的类型有时用“b”表示,并且在步骤s605处指定的类型的氨基酸有时用氨基酸b表示。
82.例如,在由结构指定信息10指示的氨基酸的序列中,对指定单元112参考“a”型氨
基酸指定排列在距“a”型氨基酸距离为n处的“b”型氨基酸。
83.随后,特征量计算单元110通过对数计数单元113对与氨基酸a相距n个氨基酸的氨基酸b的数目进行计数(步骤s606)。
84.例如,对数计数单元113对包括氨基酸a和位于距氨基酸a第n个位置的氨基酸b的对的数目进行计数。
85.随后,特征量计算单元110确定是否执行从步骤s603到步骤s606的处理,直到n的值达到由结构指定信息10指示的氨基酸的序列中的最大值(步骤s607)。n的最大值可以是由结构指定信息10指示的环肽中包括的氨基酸的数目。
86.在步骤s607处,在n的值未被最大化的情况下,特征量计算单元110设置n=n+1(步骤s608)并返回至步骤s605。
87.在步骤s607处,在n的值最大化的情况下,特征量计算单元110确定是否针对结构指定信息10中包括的所有类型的氨基酸执行了从步骤s604到步骤s608的处理(步骤s609)。
88.在步骤s609处,在未针对所有类型的氨基酸执行处理的情况下,特征量计算单元110将与在步骤s603处指定的类型不同的类型设置为类型“a”(步骤s610),并返回至步骤s604。
89.在步骤s609处,在针对所有类型的氨基酸执行了处理的情况下,特征量计算单元110通过特征量获取单元114获取特征量30,在该特征量30中对数计数单元113所获取的数目由矩阵表示(步骤s611)。
90.随后,特征量计算单元110通过输出单元115将所获取的特征量30输出至外部装置例如信息处理装置200(步骤s612),并结束处理。
91.以这种方式,该实施方式的特征量计算装置100执行接收结构指定信息的处理,该结构指定信息指定关于环肽的多个原子团(氨基酸)的每个类型和多个原子团的序列,该环肽是其中被分类成多个类型的多个原子团被循环按序排列的环状分子。此外,当特征量计算装置100接收到结构指定信息时,基于该结构指定信息,这执行从多个类型中指定可选的第一类型(氨基酸a)和可选的第二类型(氨基酸b)的处理,以及从多个原子团中指定被分类为第一类型的一个或多个第一原子团和被分类为第二类型的一个或多个第二原子团的处理。此外,特征量计算装置100基于结构指定信息执行计算第一原子团和第二原子团的对的数目的处理,在所述对中在第一原子团和第二原子团的序列中第一原子团与第二原子团之间的距离n是预定距离。
92.可以基于通过应用该实施方式获取的特征量计算多个环肽的相互相似性,并且将特征量应用于机器学习等的处理。图7a是用于示出使用特征量的处理的第一图。图7b是用于示出使用特征量的处理的第二图。图7c是用于示出使用特征量的处理的第三图。
93.图7a、图7b和图7c分别示出了通过关于环肽71、环肽72和环肽73应用该实施方式获取特征量的情况。
94.图7a所示的特征量31是通过关于包括两个氨基酸a和一个氨基酸b的环肽71应用该实施方式获取的特征量。此外,图7b所示的特征量32是通过关于包括三个氨基酸a和一个氨基酸b的环肽72应用该实施方式获取的特征量。此外,图7c所示的特征量33是通过将该实施方式应用于包括两个氨基酸a和三个氨基酸b的环肽73而获取的特征量。
95.在该实施方式中,信息处理装置200基于由特征量计算装置100计算的特征量31、
32和33来计算环肽71、72和73的相似性。例如,在该实施方式中,使用余弦相似性公式计算环肽71、72和73的相似性。余弦相似性公式是将矩阵视为一行中的向量并根据向量之间形成的角度计算相似性的方法。
96.在图7a至图7c的示例中,环肽71与环肽72之间的相似性为0.77,环肽71与环肽73之间的相似性为0.51,并且环肽72与环肽73之间的相似性为0.50。
97.以这种方式,通过使用该实施方式所应用于的特征量,可以比较和检查环肽之间的相似性,而不管环肽的大小等。此外,信息处理装置200可以基于包括已知环肽的属性值的教师数据来执行机器学习,并且基于由特征量计算装置100计算的特征量31、32和33来估计环肽71、72和73的属性值。此外,信息处理装置200可以基于关于特征量31、32和33以及环肽71、72和73的属性值的信息来执行机器学习。注意,信息处理装置200是计算机,该计算机包括经由总线彼此相互连接的输入装置、输出装置、驱动装置、辅助存储装置、存储器装置、算术处理装置和接口装置。
98.(第二实施方式)
99.在下文中,参照附图描述第二实施方式。第二实施方式与第一实施方式的不同之处在于指定氨基酸之间的距离n是在环状分子中的环的第一方向上的距离还是在与第一方向相反的第二方向上的距离。在下面对第二实施方式的描述中,描述了与第一实施方式的不同,并且具有与第一实施方式中的功能配置类似的功能配置的部件由与第一实施方式的描述中使用的附图标记类似的附图标记表示,并且省略了对其的描述。
100.图8a至图8c是用于示出第二实施方式的特征量的图。图8a和图8b示出了在氨基酸的序列中“a”型氨基酸、“b”型氨基酸和“c”型氨基酸通过酰胺键(-nhco-)键合的状态。
101.在这种情况下,由于氨基酸通过酰胺键彼此键合,因此在沿附图上的顺时针方向将氨基酸a、氨基酸b和氨基酸c按此顺序按序排列的情况与沿附图上的逆时针方向将氨基酸a、氨基酸b和氨基酸c按此顺序按序排列的情况之间,结构是不同的。
102.图8a示出了沿顺时针方向(箭头y1的方向)将氨基酸a、氨基酸b和氨基酸c按此顺序按序排列的情况的示例。在这种情况下,氨基酸a的n末端与氨基酸b的c末端键合,并且氨基酸b的n末端与氨基酸c的c末端键合。
103.图8b示出了沿逆时针方向(箭头y2的方向)将氨基酸a、氨基酸b和氨基酸c按此顺序按序排列的情况。在这种情况下,氨基酸a的c末端与氨基酸b的n末端键合,并且氨基酸b的c末端与氨基酸c的n末端键合。
104.因此,图8a中的其中距离n=1的氨基酸a和氨基酸b的对与图8b中的其中距离n=1的氨基酸a和氨基酸b的对具有不同的结构。
105.在该实施方式中,聚焦于该点,当确定氨基酸的对时,指定氨基酸之间的距离是沿顺时针方向的距离还是沿逆时针方向的距离。例如,在该实施方式中,与结构指定信息10一起,接受指定氨基酸之间的距离是沿顺时针方向的距离还是沿逆时针方向的距离的方向指定信息的输入。
106.然后,在该实施方式中,基于结构指定信息10和方向指定信息计算环肽的特征量。
107.此外,在该实施方式中,由于氨基酸之间的距离的方向是由方向指定信息指定的,因此即使包括在对中的氨基酸是相同的,它们也被计数为不同的对。
108.图8c所示的环肽80包括氨基酸a、氨基酸b、氨基酸c和两个其他氨基酸。
109.在这种情况下,在使氨基酸之间的距离为沿顺时针方向的距离的情况下,氨基酸a和氨基酸c的对是氨基酸a和沿顺时针方向与氨基酸a相距两个氨基酸的氨基酸c的对,以及氨基酸c和沿顺时针方向与氨基酸c相距三个氨基酸的氨基酸a的对。
110.例如,在环肽80中,在使沿顺时针方向的距离成为氨基酸之间的距离的情况下,包括氨基酸a和氨基酸c的对是其中距离n=2的氨基酸a和氨基酸c的对以及其中距离n=3的氨基酸c和氨基酸a的对。
111.以这种方式,在该实施方式中,即使当包括在对中的氨基酸的类型相同时,也对指定距离时的方向进行指定,使得分别对这些对进行计数。因此,在该实施方式中,可以更精确地表达氨基酸的序列。
112.在下文中,参照图9描述该实施方式的特征量计算单元110a的功能配置。图9是用于示出第二实施方式的特征量计算单元的功能的图。
113.该实施方式的特征量计算单元110a包括输入接收单元111、对指定单元112a、对数计数单元113、特征量获取单元114、输出单元115以及方向指定单元116。
114.对指定单元112a将位于沿方向指定单元116所指定的方向距某个氨基酸距离为n处的位置的另一氨基酸指定为与该某个氨基酸配对的氨基酸。
115.方向指定单元116基于从信息处理装置200等输入的方向指定信息来指定对环肽中的氨基酸之间的距离进行计数时的方向。
116.在下文中,参照图10描述该实施方式的特征量计算单元110a的处理。图10是用于示出第二实施方式的特征量计算装置的处理的流程图。
117.该实施方式的特征量计算单元110a通过输入接收单元111接收结构指定信息10的输入(步骤s1001)。随后,特征量计算单元110a通过输入接收单元111接收方向指定信息的输入(步骤s1002)。
118.由于图10中从步骤s1003到步骤s1005的处理类似于图6中从步骤s602到步骤s604的处理,因此省略对其的描述。
119.在步骤s1005之后,特征量计算单元110a通过对指定单元112a参考在步骤s1002处输入的方向指定信息,指定排列在沿指定方向距“a”型氨基酸距离为n处的位置的氨基酸(步骤s1006),并转移至步骤s1007。
120.由于图10中从步骤s1007到步骤s1013的处理类似于图6中从步骤s606到步骤s612的处理,因此省略对其的描述。
121.以这种方式,在该实施方式中,当指定位于距某个氨基酸距离为n处的位置的另一氨基酸时,沿指定方向指定距离为n处的另一氨基酸。因此,根据该实施方式,可以将由氨基酸的序列形成的环肽的结构高精度地反映在特征量中。
技术特征:
1.一种存储特征量计算程序的非暂态计算机可读记录介质,所述特征量计算程序用于使计算机执行处理,所述处理包括:接收结构指定信息,所述结构指定信息指定关于环状分子的多个原子团中的每个原子团的类型和所述多个原子团的序列,其中在所述环状分子中,被分类成多个类型的所述多个原子团被循环按序排列;在所述多个类型中指定可选的第一类型和可选的第二类型;基于所述结构指定信息,从所述多个原子团中指定被分类为所述第一类型的一个或多个第一原子团和被分类为所述第二类型的一个或多个第二原子团;以及基于所述结构指定信息,计算所述第一原子团和所述第二原子团的对的数目,在所述对中,所述第一原子团与所述第二原子团之间在所述序列中的相互距离是预定距离。2.根据权利要求1所述的非暂态计算机可读记录介质,还使所述计算机执行以下处理,所述处理包括:接收方向指定信息,所述方向指定信息指定沿着所述环状分子的环的第一方向或者与所述第一方向相反的、沿着所述环的第二方向;以及在由所述方向指定信息指定的方向上计算所述距离。3.根据权利要求1或2所述的非暂态计算机可读记录介质,其中,所述多个原子团中的每个原子团是氨基酸,并且所述环状分子是环肽。4.一种由计算机实现的特征量计算方法,所述特征量计算方法包括:接收结构指定信息,所述结构指定信息指定关于环状分子的多个原子团中的每个原子团的类型和所述多个原子团的序列,其中在所述环状分子中,被分类成多个类型的所述多个原子团被循环按序排列;在所述多个类型中指定可选的第一类型和可选的第二类型;基于所述结构指定信息,从所述多个原子团中指定被分类为所述第一类型的一个或多个第一原子团和被分类为所述第二类型的一个或多个第二原子团;以及基于所述结构指定信息,计算所述第一原子团和所述第二原子团的对的数目,在所述对中,所述第一原子团与所述第二原子团之间在所述序列中的相互距离是预定距离。5.一种特征量计算装置,包括:接收单元,其接收结构指定信息,所述结构指定信息指定关于环状分子的多个原子团中的每个原子团的类型和所述多个原子团的序列,其中在所述环状分子中,被分类成多个类型的所述多个原子团被循环按序排列;第一处理单元,其在所述多个类型中指定可选的第一类型和可选的第二类型;第二处理单元,其基于所述结构指定信息,从所述多个原子团中指定被分类为所述第一类型的一个或多个第一原子团和被分类为所述第二类型的一个或多个第二原子团;以及第三处理单元,其基于所述结构指定信息,计算所述第一原子团和所述第二原子团的对的数目,在所述对中,所述第一原子团与所述第二原子团之间在所述序列中的相互距离是预定距离。
技术总结
涉及计算机可读记录介质、特征量计算方法和特征量计算装置。一种存储特征量计算程序的计算机可读记录介质,特征量计算程序使计算机执行处理,包括:接收结构指定信息,结构指定信息指示关于环状分子的原子团中的每个原子团的类型和原子团的序列,在环状分子中被分类成多个类型的原子团被循环按序排列;在多个类型中指定可选的第一类型和可选的第二类型;基于结构指定信息,从原子团中指定被分类为第一类型的第一原子团中的一个或更多个第一原子团和被分类为第二类型的第二原子团中的一个或更多个第二原子团;以及基于结构指定信息,计算第一原子团和第二原子团的对的数目,在所述对中第一原子团与第二原子团之间在序列中的相互距离是某距离。相互距离是某距离。相互距离是某距离。
技术研发人员:寺岛千绘子
受保护的技术使用者:富士通株式会社
技术研发日:2022.10.14
技术公布日:2023/7/31
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:用于镁电池的涂料的制作方法 下一篇:用于向用户提供定向内容的系统和方法与流程