基于多重蛋白流式数据筛选设门分群方法、装置与流程

未命名 08-29 阅读:72 评论:0


1.本发明属于流式多因子检测技术领域,尤其涉及一种基于多重蛋白流式数据设门分群方法、装置。


背景技术:

2.近年来体外诊断试剂迅速发展,流式体外检测试剂盒品类日新月异。而流式数据fsc-a与ssc-a坐标数据的分布形态不确定,大都偏态分布,因为各种原因,可能导致出现很多细胞碎片使数据整体区间扩大;或者出现细胞粘连出现很多无效数据。
3.而目前流式多因子检测数据均采用人工去除部分无效数据,再进行数据自动或手动分群,提取出有效数据,导致流式多因子检测结果判读步骤繁杂且费时费力。


技术实现要素:

4.针对上述现有技术中描述的不足,本发明提供一种基于多重蛋白流式数据设门分群方法、装置,可自动排除样本中的杂质数据,并进行全自动设门分群得到原始二值数据分群,荧光通道全自动设门将样本因子数据精准分类提取。
5.本发明所采用的技术方案如下:
6.一种基于多重蛋白流式数据筛选设门分群方法,包括步骤如下,
7.步骤1:读取样本流式数据文件和相应的试剂盒配置信息,得到原始数据和设门分群参数;
8.所述原始数据为样本文件的所有细胞采样事件矩阵;
9.所述的设门分群参数,包括设门通道坐标、设门个数、因子分类通道坐标和样本因子分群个数;所述的设门通道包括前向通道fsc和侧向通道ssc;
10.所述的因子分类通道包括报告荧光通道reportx和分类荧光通道classifyy。
11.步骤2:获取设门通道坐标下的原始二值数据并两次筛分后去除无效数据得到筛分后设门通道数据;
12.步骤21:根据设门通道坐标从原始数据中获得前向通道fsc的原始二值数据和侧向通道ssc的原始二值数据,即待筛选数据;
13.步骤22:分别计算待筛选数据的前向通道fsc和侧向通道ssc的数据范围、平均值、中位数、比值;所述的比值为平均值与中位数的比值;
14.步骤23:判断前向通道fsc的数据个数与fsc设定个数的大小,若前向通道fsc的数据个数<fsc设定个数,则跳转到步骤3;若前向通道fsc的数据个数≥fsc设定个数,则分别对前向通道fsc的数据和侧向通道ssc的数据进行剔除杂质数据,得到前向通道fsc的预处理数据和侧向通道ssc的预处理数据;
15.剔除杂质数据的剔除规则是根据平均值与中位数所在数据范围及比值关系,判断并去除杂质数据得到预处理后的待筛选数据。所述的数据个数是设门通道下的细胞采样事件矩阵行数;
16.所述剔除杂质数据的具体步骤为:
17.所述xavg是前向通道fsc数据平均值;
18.所述xmid是前向通道fsc数据中位数;
19.所述xrange是前向通道fsc数据范围;
20.所述xratio是前向通道fsc数据平均值与中位数的比值;
21.所述yavg是侧向通道ssc数据平均值;
22.所述ymid是侧向通道ssc数据中位数;
23.所述yrange是侧向通道ssc数据范围;
24.所述yratio是侧向通道ssc数据平均值与中位数的比值;
25.步骤231:若条件yavg《20%*yrange&&(7.5《yratio《36)||(3.3《yratio&&3.3》xratio)||(2.3《yratio&&3.0》xratio》2.0)或者15%*yrange《yavg《20%*yrange&&ymid《10%*yrange&&yratio》2&&xratio》0.98成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
26.步骤232:若条件yavg《23%*yrange&&ymid《10%*yrange&&yratio》1.2)&&yratio《2.6或者yavg《20%*yrange&&1.2《yratio《1.85&&1.0《xratio《2.3成立,剔除大于80%*yrange的向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
27.步骤233:若条件(yavg》22%*yrange||(yavg《22%*yrange&&(xratio《0.98)||xratio》2.0)))&&ymid《16.5%*yrange&&yratio》1.2成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
28.步骤234:若条件yavg《28%*yrange&&ymid《16%*yrange&&yratio》=1.0)&&1.0《xratio《2.0)或者yavg《20%*yrange&&yratio》1.0或者ymid《20%*yrange&&yratio《1.0成立,剔除大于80%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
29.步骤235:若条件xavg《12.5%*xrange&&xratio》3.5成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
30.步骤236:若条件xmid《20%*xrange&&xratio《1.0或者xmid《33.3%*xrange&&xratio《1.0)&&yratio《1.0成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
31.步骤237:若条件xratio》1.1&&yratio》1.42成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据并且剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
32.步骤238:若条件xavg《20%*xrange&&xratio》=1.0或者xavg《33.3%*xrange&&xmid》25%*xrange&&xratio》1.0或者xmid《42%*xrange&&0.8《=xratio《0.91成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
33.步骤239:ymid》24%*yrange&&yavg》62.5%*yrange&&yratio》1.0或者ymid《33.3%*yrange&&yavg》25%*yrange&&yratio《1.0成立,剔除大于80%*yrange的侧向通道
ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
34.步骤2310:若条件xmid》28.5%*xrange&&xavg》50%*xrange&&xratio》1.0或者xmid《25%*xrange&&xavg《67%*xrange&&xavg》50%*xrange&&xratio》=1.1或者xavg》50%*xrange&&xavg《67%*xrange&&xmid《25%*xrange&&xratio》1.0成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
35.步骤24:判断侧向通道ssc的数据个数与ssc设定个数的大小,若侧向通道ssc的数据个数<ssc设定个数,则跳转到步骤3;若侧向通道ssc的数据个数≥ssc设定个数,根据优化后的3σ原则分别对前向通道fsc的预处理数据和侧向通道ssc的预处理后的二值数据去除偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据。
36.所述的数据个数是设门通道下的细胞采样事件矩阵行数;
37.所述去除偏离数据的步骤为:
38.步骤241:获得前向通道fsc的中间数据和侧向通道ssc的中间数据;
39.去除前向通道fsc的预处理数据中的最大值和最小值得到前向通道fsc的中间数据,去除侧向通道ssc的预处理数据中的最大值和最小值得到侧向通道ssc的中间数据;
40.步骤242:分别计算前向通道fsc中间数据的中位数和侧向通道ssc中间数据的中位数:
41.步骤243:使用中位数替换平均值分别计算前向通道fsc中间数据的标准差和侧向通道ssc中间数据的标准差:
42.步骤244:根据3σ原则的剔除条件分别剔除前向通道fsc中间数据的偏离数据和侧向通道ssc中间数据的偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据:
43.所述的剔除条件为剔除大于中位数+3*标准差的数据和小于中位数-3*标准差的数据。
44.步骤3:获取设门凸包多边形和分群数据;
45.步骤31:获取筛分后原始二值数据的设门凸包多边形;
46.步骤311:将前向通道fsc的筛分数据和侧向通道ssc的筛分数据限定范围内的原始二值数据按压缩比例n进行标准化处理,并将标准化处理后的数据均分成n组;
47.步骤312:获得长度为n的二值布尔数组:
48.比较每组标准化数据的前向通道fsc均值与前向通道fsc筛分数据的数据个数*n2*阈值的大小关系;
49.若组标准化数据的前向通道fsc均值≥前向通道fsc筛分数据的数据个数*n2*阈值,则为true;若组标准化数据的前向通道fsc均值<前向通道fsc筛分数据的数据个数*n2*阈值,则为false,得到长度为n的二值布尔数组;
50.所述阈值不小于2且不大于60,阈值越大,设门凸包多边形面积越小。
51.步骤313:获得筛选后原始二值数据的设门凸包多边形;
52.步骤3131:选择二值布尔数组中上下左右的二值布尔值都为false的二值布尔值为设门凸包边界点;
53.步骤3132:根据压缩比例n反标准化得到筛选后原始二值数据的设门凸包多边形;
54.步骤32:根据设门凸包多边形和筛选后原始二值数据进行设门分群;
55.步骤321:获取位于设门凸包多边形限定的数值范围内的筛选后原始二值数据,并将该原始二值数据作为待设门分群数据,对待设门分群数据进行设门分群;
56.步骤322:当设门个数大于1时,根据设门分群二值数据的数据个数与原始二值数据的数据个数或设门分群的设门凸包多边形之间面积关系筛选最终设门分群的二值数据;
57.当使用数据个数作为筛选标准时,所述的数据个数是设门通道下的细胞采样事件矩阵行数:
58.若各个设门分群二值数据的数据个数之和》原始二值数据的数据个数*0.9;或者单个设门分群二值数据的数据个数》原始二值数据的数据个数*0.85,则调节阈值并返回步骤312,重新获得设门凸包多边形,反之则为最终设门分群;
59.当使用设门凸包多边形面积作为筛选标准时:
60.若其中一个设门分群的凸包多边形中前向通道fsc的最大差值》另一个设门分群的凸包多边形中前向通道fsc最大差值*3,则调节阈值并返回步骤312,重新获得设门凸包多边形,反之则为最终设门分群;
61.步骤4:获得设门分群后报告荧光通道reportx与分类荧光通道classifyy的二值数据并进行分群,得到样本文件的因子分群;
62.步骤41:根据最终设门分群的二值数据、原始数据及试剂盒配置信息的报告荧光通道reportx与分类荧光通道classifyy,得到报告荧光通道reportx与分类荧光通道classifyy的二值数据;
63.步骤42:计算分类荧光通道classifyy数据的峰谷,取峰谷作为分类凸包多边形二值数据的classifyy值;
64.步骤43:根据分类凸包多边形二值数据的classifyy值对报告荧光通道reportx与分类荧光通道classifyy的二值数据进行分群;
65.步骤44:对各个分群的二值数据采用优化后的3σ原则剔除偏离数据,得到最终的样本文件的因子分群;
66.步骤5:对样本文件的因子分群数据进行统计计算,得到因子微球个数及平均荧光强度。
67.本发明还提供了一种基于多重蛋白流式数据筛选设门分群装置,包括创建实验面板单元、数据筛选单元、设门单元和统计分析单元;所述的创建实验面板单元,包括样本数据读取模块和试剂盒信息提取模块;所述样本数据读取模块,用于读取样本流式数据文件获得原始细胞采样事件矩阵;所述试剂盒信息提取模块,用于提取试剂盒配置信息获得设门分群参数;
68.所述的数据筛选单元,包括数据预处理模块和优化3σ筛选模块;
69.所述的数据预处理模块,根据平均值及中位数与数据分布形态的关系剔除部分无效数据,使数据更趋于正太分布;
70.所述的优化3σ筛选模块,对要处理的数据去除最大值最小值后用中位数替换传统的3σ原则的平均值进行计算,剔除偏离数据;
71.设门单元,对筛选后的数据进行设门分群,并对分群后的数据进行判断得到最优化的设门分群,再进行因子分群得到样本文件的因子分群;
72.统计分析单元,包括统计单元,所述统计单元用于统计计算因子微球个数及平均
荧光强度。
73.作为本发明的优选方案,所述创建实验面板单元还包括标准曲线设置模块,所述标准曲线设置模块,设置流式实验的标准样本的浓度、稀释倍数等信息;
74.作为本发明的优选方案,所述的统计分析单元还包括标准曲线拟合模块,所述标准曲线拟合模块采用数据取对数的四参数但不限于数据取对数的四参数拟合。
75.本发明可以自动对多重蛋白流式数据进行预处理及筛选,去除杂质数据,更精准地保留有效数据,对筛选数据进行自动设门分群,统计分析得到结果;基于本发明装置的数据预处理和筛选功能,可对含较多杂质的数据进行筛选处理,最后设门得到有效结果,扩大了本发明方法的数据适用范围;并且数据的筛选、设门分群及分析均可基于本发明方法一键自动完成,减少了人工操作,提高了检测效率。
附图说明
76.图1为本发明筛选设门分群方法的流程图。
77.图2为本发明筛选设门分群装置的原理图。
78.图3为本发明事例1未经预处理及筛选的设门数据散点图。
79.图4为本发明事例1经筛选设门数据散点图。
80.图5为本发明事例1设门分群后的数据散点图。
81.图6为本发明事例1因子分群后的数据散点图。
具体实施方式
82.本发明提供了一种基于多重蛋白流式数据筛选设门分群方法的实施例,包括步骤如下,如图1所示,
83.步骤1:读取样本流式数据文件和相应的试剂盒配置信息,得到原始数据和设门分群参数;
84.所述原始数据为样本文件的所有细胞采样事件矩阵;
85.所述的设门分群参数,包括设门通道坐标、设门个数、因子分类通道坐标和样本因子分群个数;所述的设门通道包括前向通道fsc和侧向通道ssc;
86.所述的因子分类通道包括报告荧光通道reportx和分类荧光通道classifyy。
87.步骤2:获取设门通道坐标下的原始二值数据并两次筛分后去除无效数据得到筛分后设门通道数据;
88.步骤21:根据设门通道坐标从原始数据中获得前向通道fsc的原始二值数据和侧向通道ssc的原始二值数据,即待筛选数据;
89.步骤22:分别计算待筛选数据的前向通道fsc和侧向通道ssc的数据范围、平均值、中位数、比值;所述的比值为平均值与中位数的比值;
90.步骤23:判断前向通道fsc的数据个数与fsc设定个数的大小,本实施例中fsc设定个数为1000,若前向通道fsc的数据个数<fsc设定个数,则跳转到步骤3;若前向通道fsc的数据个数≥fsc设定个数,则分别对前向通道fsc的数据和侧向通道ssc的数据进行剔除杂质数据,得到前向通道fsc的预处理数据和侧向通道ssc的预处理数据;所述的数据个数是设门通道下的细胞采样事件矩阵行数;
91.剔除杂质数据的剔除规则是根据平均值与中位数所在数据范围及比值关系,判断并去除杂质数据得到预处理后的待筛选数据;具体步骤为:
92.所述xavg是前向通道fsc数据平均值;
93.所述xmid是前向通道fsc数据中位数;
94.所述xrange是前向通道fsc数据范围;
95.所述xratio是前向通道fsc数据平均值与中位数的比值;
96.所述yavg是侧向通道ssc数据平均值;
97.所述ymid是侧向通道ssc数据中位数;
98.所述yrange是侧向通道ssc数据范围;
99.所述yratio是侧向通道ssc数据平均值与中位数的比值;
100.步骤231:若条件yavg《20%*yrange&&(7.5《yratio《36)||(3.3《yratio&&3.3》xratio)||(2.3《yratio&&3.0》xratio》2.0)或者15%*yrange《yavg《20%*yrange&&ymid《10%*yrange&&yratio》2&&xratio》0.98成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
101.步骤232:若条件yavg《23%*yrange&&ymid《10%*yrange&&yratio》1.2)&&yratio《2.6或者yavg《20%*yrange&&1.2《yratio《1.85&&1.0《xratio《2.3成立,剔除大于80%*yrange的向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
102.步骤233:若条件(yavg》22%*yrange||(yavg《22%*yrange&&(xratio《0.98)||xratio》2.0)))&&ymid《16.5%*yrange&&yratio》1.2成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
103.步骤234:若条件yavg《28%*yrange&&ymid《16%*yrange&&yratio》=1.0)&&1.0《xratio《2.0)或者yavg《20%*yrange&&yratio》1.0或者ymid《20%*yrange&&yratio《1.0成立,剔除大于80%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
104.步骤235:若条件xavg《12.5%*xrange&&xratio》3.5成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
105.步骤236:若条件xmid《20%*xrange&&xratio《1.0或者xmid《33.3%*xrange&&xratio《1.0)&&yratio《1.0成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
106.步骤237:若条件xratio》1.1&&yratio》1.42成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据并且剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
107.步骤238:若条件xavg《20%*xrange&&xratio》=1.0或者xavg《33.3%*xrange&&xmid》25%*xrange&&xratio》1.0或者xmid《42%*xrange&&0.8《=xratio《0.91成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;
108.步骤239:ymid》24%*yrange&&yavg》62.5%*yrange&&yratio》1.0或者ymid《
33.3%*yrange&&yavg》25%*yrange&&yratio《1.0成立,剔除大于80%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;
109.步骤2310:若条件xmid》28.5%*xrange&&xavg》50%*xrange&&xratio》1.0或者xmid《25%*xrange&&xavg《67%*xrange&&xavg》50%*xrange&&xratio》=1.1或者xavg》50%*xrange&&xavg《67%*xrange&&xmid《25%*xrange&&xratio》1.0成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行。
110.预处理后将因细胞粘连出现数据偏小和细胞碎片出现数据偏大的数据进行剔除,缩小了数据范围,该步骤替代现有设门技术采用的人工调整设门数据范围,缩短了数据处理时间,提高了效率。
111.步骤24:判断侧向通道ssc的数据个数与ssc设定个数的大小,本实施例中ssc设定个数为400;若侧向通道ssc的数据个数<ssc设定个数,则跳转到步骤3;若侧向通道ssc的数据个数≥ssc设定个数,则根据优化后的3σ原则分别对前向通道fsc的预处理数据和侧向通道ssc的预处理数据去除偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据;
112.所述的数据个数是设门通道下的细胞采样事件矩阵行数;
113.所述去除偏离数据的步骤为:
114.步骤241:获得前向通道fsc的中间数据和侧向通道ssc的中间数据:
115.去除前向通道fsc的预处理数据中的最大值和最小值得到前向通道fsc的中间数据,去除侧向通道ssc的预处理数据中的最大值和最小值得到侧向通道ssc的中间数据;
116.步骤242:分别计算前向通道fsc中间数据的中位数和侧向通道ssc中间数据的中位数:
117.步骤243:使用中位数替换平均值分别计算前向通道fsc中间数据的标准差和侧向通道ssc中间数据的标准差:
118.步骤244:根据3σ原则的剔除条件分别剔除前向通道fsc中间数据的偏离数据和侧向通道ssc中间数据的偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据:
119.所述的剔除条件为剔除大于中位数+3*标准差的数据和小于中位数-3*标准差的数据。
120.传统的3σ原则是采用平均值计算标准差,筛选范围为平均值+3*标准差及小于平均值-3*标准差,对于峰值不同的多峰分布数据,会出现数据误删情况。而本技术针对的是流式数据,而流式数据的分布特点是峰值不同的多峰分布,所以使用传统的3σ原则不适用本技术。
121.然而,不管数据何种分布形态,中位数比平均值更趋近数据峰值,故将传统的3σ原则内平均值替换成中位数来剔除离散数据。
122.并且本技术为了使偏离数据最大化去除,先将数据的最大值与最小值去除,再计算中位数及标准差。
123.步骤3:获取设门凸包多边形和分群数据;
124.步骤31:获取筛分后原始二值数据的设门凸包多边形;
125.步骤311:将前向通道fsc的筛分数据和侧向通道ssc的筛分数据限定范围内的原
始二值数据按压缩比例n进行标准化处理,并将标准化处理后的数据均分成n组;本实施例压缩比例n为100。
126.步骤312:获得长度为n的二值布尔数组:
127.比较每组标准化数据的前向通道fsc均值与前向通道fsc筛分数据的数据个数*n2*阈值的大小关系;
128.若组标准化数据的前向通道fsc均值≥前向通道fsc筛分数据的数据个数*n2*阈值,则为true;若组标准化数据的前向通道fsc均值<前向通道fsc筛分数据的数据个数*n2*阈值,则为false,得到长度为n的二值布尔数组;
129.所述阈值不小于2且不大于60,阈值越大,设门凸包多边形面积越小。
130.步骤313:获得筛选后原始二值数据的设门凸包多边形;
131.步骤3131:选择二值布尔数组中上下左右的二值布尔值都为false的二值布尔值为设门凸包边界点;
132.步骤3132:根据压缩比例n反标准化得到筛选后原始二值数据的设门凸包多边形;
133.步骤32:根据设门凸包多边形和筛选后原始二值数据进行设门分群;
134.步骤321:获取位于设门凸包多边形限定的数值范围内的筛选后原始二值数据,并将该原始二值数据作为待设门分群数据,对待设门分群数据进行设门分群;
135.步骤322:当设门个数大于1时,根据设门分群二值数据的数据个数与原始二值数据的数据个数或设门分群的设门凸包多边形之间面积关系筛选最终设门分群的二值数据;
136.当使用数据个数作为筛选标准时,所述的数据个数是设门通道下的细胞采样事件矩阵行数:
137.若各个设门分群二值数据的数据个数之和》原始二值数据的数据个数*0.9;或者单个设门分群二值数据的数据个数》原始二值数据的数据个数*0.85,则调节阈值并返回步骤312,重新获得设门凸包多边形,本实施例中调节阈值是将阈值加2,反之则为最终设门分群;
138.当使用设门凸包多边形面积作为筛选标准时:
139.若其中一个设门分群的凸包多边形中前向通道fsc的最大差值》另一个设门分群的凸包多边形中前向通道fsc最大差值*3,则调节阈值并返回步骤312,重新获得设门凸包多边形,本实施例中调节阈值是将阈值加2,反之则为最终设门分群;
140.步骤4:获得设门分群后报告荧光通道reportx与分类荧光通道classifyy的二值数据并进行分群,得到样本文件的因子分群;
141.步骤41:根据最终设门分群的二值数据、原始数据及试剂盒配置信息的报告荧光通道reportx与分类荧光通道classifyy,得到报告荧光通道reportx与分类荧光通道classifyy的二值数据;
142.步骤42:计算分类荧光通道classifyy数据的峰谷,取峰谷作为分类凸包多边形二值数据的classifyy值;
143.步骤43:根据分类凸包多边形二值数据的classifyy值对报告荧光通道reportx与分类荧光通道classifyy的二值数据进行分群;
144.步骤44:对各个分群的二值数据采用优化后的3σ原则剔除偏离数据,得到最终的样本文件的因子分群;
145.步骤5:对样本文件的因子分群数据进行统计计算,得到因子微球个数及平均荧光强度;微球个数是设门通道或者因子分群通道的二值数据个数;所述的平均荧光强度,指因子分群的二值数据的数据总和除以数据个数。
146.为了进一步对本发明原理进行解释,现以一个具体事例按上述方法步骤进行解释说明。
147.在本事例中,方法以c#编程实现。
148.本事例以某13因子流式检测试剂盒样本数据文件进行筛选设门分群。
149.读取文件内细胞采样事件矩阵,共含2684个细胞事件;
150.读取试剂盒配置信息,获得如下设门分群参数:
151.设门通道为fsc-a(前向通道)、ssc-a(侧向通道);
152.设门个数为2;
153.因子分类通道坐标fl4-h(报告荧光通道)、fl-h9(分类荧光通道);
154.样本因子个数为13;
155.因子分群内平均微球个数如下表所示:
[0156][0157]
原始数据设门通道数据范围为:fsc-a:(100129,22396939)、ssc-a:(14475,19464175),散点图显示如图3;
[0158]
对设门数据进行预处理及筛选将部分左下角粘连细胞及右上角细胞碎片数据排除后,设门通道数据范围为:fsc-a:(111255.4,2534858)、ssc-a:(16084.1,2906948.5),散点图显示如图4;
[0159][0160]
对筛选后数据进行设门,得到设门凸包多边形和设门分群,根据各个设门分群二
值数据个数与原始二值数据个数大小关系、凸包多边形的面积关系,排除左下角较小分群及右上角较小分群,筛选出最终设门分群二值数据,设门凸包多边形其中微球a占39%、微球b占48%;设门分群散点图如图5所示;
[0161]
再对报告荧光通道reportx及分类荧光通道classifyy数据进行分群得到样本文件的数据因子分群,散点图分群显示如图6,图6中fl4-h代表reportx,fl9-h代表classifyy;
[0162]
最终得到的因子分群微球个数如下表所示:
[0163]
12345678910111213163195170165160173162180182196158182175
[0164]
并且可以通过样本文件的数据因子分群微球个数与试剂盒配置信息因子平均微球个数*[0.5,1.5]的符合性,评价本事例中设门方法的有效性。
[0165]
经判断,可知本事例100%因子分群结果在试剂盒配置信息因子平均微球个数*[0.5,1.5]的范围内,说明本技术方法是有效的。
[0166]
本发明还提供了一种基于多重蛋白流式数据筛选设门分群装置的实施例,如图2所示,包括创建实验面板单元、数据筛选单元、设门单元和统计分析单元;所述的创建实验面板单元,包括样本数据读取模块和试剂盒信息提取模块;所述样本数据读取模块,用于读取样本流式数据文件获得原始细胞采样事件矩阵;所述试剂盒信息提取模块,用于提取试剂盒配置信息获得设门分群参数;
[0167]
所述的数据筛选单元,包括数据预处理模块和优化3σ筛选模块;
[0168]
所述的数据预处理模块,根据平均值及中位数与数据分布形态的关系剔除部分无效数据,使数据更趋于正太分布;
[0169]
所述的优化3σ筛选模块,对要处理的数据去除最大值最小值后用中位数替换传统的3σ原则的平均值进行计算,剔除偏离数据;
[0170]
设门单元,对筛选后的数据进行设门分群,并对分群后的数据进行判断得到最优化的设门分群,再进行因子分群得到样本文件的因子分群;
[0171]
统计分析单元,包括统计单元,所述统计单元用于统计计算因子微球个数及平均荧光强度。
[0172]
为了能直接输出曲线,本实施例中在创建实验面板单元还设置有标准曲线设置模块,所述标准曲线设置模块,设置流式实验的标准样本的浓度、稀释倍数等信息;
[0173]
并且在统计分析单元还设置标准曲线拟合模块,所述标准曲线拟合模块采用数据取对数的四参数但不限于数据取对数的四参数拟合,直接输出拟合曲线,供研究人员直观查看。
[0174]
上述实施方式中各种方法的全部或部分步骤可以通过程序来指令相关硬件完成,该程序可以存储于计算机可读存储介质中,存储介质可以包括:只读存储器、随机存储器、磁盘或光盘等。
[0175]
以上以举例方式对本技术进行了说明,但本技术不限于上述具体实施例,凡基于本技术所做的任何改动或变型均属于本技术要求保护的范围。

技术特征:
1.一种基于多重蛋白流式数据筛选设门分群方法,其特征在于,包括步骤如下,步骤1:读取样本流式数据文件和相应的试剂盒配置信息,得到原始数据和设门分群参数;所述原始数据为样本文件的所有细胞采样事件矩阵;所述的设门分群参数,包括设门通道坐标、设门个数、因子分类通道坐标和样本因子分群个数;所述的设门通道包括前向通道fsc和侧向通道ssc;所述的因子分类通道包括报告荧光通道reportx和分类荧光通道classifyy;步骤2:获取设门通道坐标下的原始二值数据并两次筛分后去除无效数据得到筛分后设门通道数据;步骤3:获取设门凸包多边形和分群数据;步骤4:获得设门分群后报告荧光通道reportx与分类荧光通道classifyy的二值数据并进行分群,得到样本文件的因子分群;步骤5:对样本文件的因子分群数据进行统计计算,得到因子微球个数及平均荧光强度。2.根据权利要求1所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于,所述步骤2的具体步骤如下:步骤21:根据设门通道坐标从原始数据中获得前向通道fsc的原始二值数据和侧向通道ssc的原始二值数据,即待筛选数据;步骤22:分别计算待筛选数据的前向通道fsc和侧向通道ssc的数据范围、平均值、中位数、比值;所述的比值为平均值与中位数的比值;步骤23:判断前向通道fsc的数据个数与fsc设定个数的大小,若前向通道fsc的数据个数<fsc设定个数,则跳转到步骤3;若前向通道fsc的数据个数≥fsc设定个数,则分别对前向通道fsc的数据和侧向通道ssc的数据进行剔除杂质数据,得到前向通道fsc的预处理数据和侧向通道ssc的预处理数据;剔除杂质数据的剔除规则是根据平均值与中位数所在数据范围及比值关系,判断并去除杂质数据得到预处理后待筛选数据;所述剔除杂质数据的具体步骤为:xavg是前向通道fsc数据平均值;xmid是前向通道fsc数据中位数;xrange是前向通道fsc数据范围;xratio是前向通道fsc数据平均值与中位数的比值;yavg是侧向通道ssc数据平均值;ymid是侧向通道ssc数据中位数;yrange是侧向通道ssc数据范围;yratio是侧向通道ssc数据平均值与中位数的比值;步骤231:若条件yavg<20%*yrange&&(7.5<yratio<36)||(3.3<yratio&&3.3>xratio)||(2.3<yratio&&3.0>xratio>2.0)或15%*yrange<yavg<20%*yrange&&ymid<10%*yrange&&yratio>2&&xratio>0.98成立,则剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;步骤232:若条件yavg<23%*yrange&&ymid<10%*yrange&&yratio>1.2)&&yratio<2.6
或者yavg<20%*yrange&&1.2<yratio<1.85&&1.0<xratio<2.3成立,剔除大于80%*yrange的向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;步骤233:若条件(yavg>22%*yrange||(yavg<22%*yrange&&(xratio<0.98)||xratio>2.0)))&&ymid<16.5%*yrange&&yratio>1.2成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;步骤234:若条件yavg<28%*yrange&&ymid<16%*yrange&&yratio>=1.0)&&1.0<xratio<2.0)或者yavg<20%*yrange&&yratio>1.0或者ymid<20%*yrange&&yratio<1.0成立,剔除大于80%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;步骤235:若条件xavg<12.5%*xrange&&xratio>3.5成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;步骤236:若条件xmid<20%*xrange&&xratio<1.0或者xmid<33.3%*xrange&&xratio<1.0)&&yratio<1.0成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;步骤237:若条件xratio>1.1&&yratio>1.42成立,剔除小于2.5%*yrange的侧向通道ssc数据及对应的前向通道fsc数据并且剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;步骤238:若条件xavg<20%*xrange&&xratio>=1.0或者xavg<33.3%*xrange&&xmid>25%*xrange&&xratio>1.0或者xmid<42%*xrange&&0.8<=xratio<0.91成立,剔除大于80%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;步骤239:若条件ymid>24%*yrange&&yavg>62.5%*yrange&&yratio>1.0或者ymid<33.3%*yrange&&yavg>25%*yrange&&yratio<1.0成立,剔除大于80%*yrange的侧向通道ssc数据及对应的前向通道fsc数据,得到新的待筛选数据并返回步骤22开始执行;步骤2310:若条件xmid>28.5%*xrange&&xavg>50%*xrange&&xratio>1.0或者xmid<25%*xrange&&xavg<67%*xrange&&xavg>50%*xrange&&xratio>=1.1或者xavg>50%*xrange&&xavg<67%*xrange&&xmid<25%*xrange&&xratio>1.0成立,剔除小于3.33%*xrange的前向通道fsc数据及对应的侧向通道ssc数据,得到新的待筛选数据并返回步骤22开始执行;步骤24:判断侧向通道ssc的数据个数与ssc设定个数的大小,若侧向通道ssc的数据个数<ssc设定个数,则跳转到步骤3;若侧向通道ssc的数据个数≥ssc设定个数,根据优化后的3σ原则分别对前向通道fsc的预处理数据和侧向通道ssc的预处理后的二值数据去除偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据。3.根据权利要求2所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于:所述去除偏离数据的步骤为:步骤241:获得前向通道fsc的中间数据和侧向通道ssc的中间数据;去除前向通道fsc的预处理数据中的最大值和最小值得到前向通道fsc的中间数据,去
除侧向通道ssc的预处理数据中的最大值和最小值得到侧向通道ssc的中间数据;步骤242:分别计算前向通道fsc中间数据的中位数和侧向通道ssc中间数据的中位数;步骤243:使用中位数替换平均值分别计算前向通道fsc中间数据的标准差和侧向通道ssc中间数据的标准差;步骤244:根据3σ原则的剔除条件分别剔除前向通道fsc中间数据的偏离数据和侧向通道ssc中间数据的偏离数据,得到前向通道fsc的筛分数据和侧向通道ssc的筛分数据;所述的剔除条件为剔除大于中位数+3*标准差的数据和小于中位数-3*标准差的数据。4.根据权利要求3所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于,所述步骤3具体步骤为:步骤31:获取筛分后原始二值数据的设门凸包多边形;步骤311:将前向通道fsc的筛分数据和侧向通道ssc的筛分数据限定范围内的原始二值数据按压缩比例n进行标准化处理,并将标准化处理后的数据分成n组;步骤312:获得长度为n的二值布尔数组:比较每组标准化数据的前向通道fsc均值与前向通道fsc筛分数据的数据个数*n2*阈值的大小关系;若组标准化数据的前向通道fsc均值≥前向通道fsc筛分数据的数据个数*n2*阈值,则为true;若组标准化数据的前向通道fsc均值<前向通道fsc筛分数据的数据个数*n2*阈值,则为false,得到长度为n的二值布尔数组;步骤313:根据二值布尔数组获得筛选后原始二值数据的设门凸包多边形;步骤32:根据设门凸包多边形和筛选后原始二值数据进行设门分群;步骤321:获取位于设门凸包多边形限定的数值范围内的筛选后原始二值数据,并将该原始二值数据作为待设门分群数据,对待设门分群数据进行设门分群;步骤322:当设门个数大于1时,根据设门分群二值数据的数据个数与原始二值数据的数据个数或设门分群的设门凸包多边形之间面积关系筛选最终设门分群的二值数据。5.根据权利要求4所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于,获得设门凸包多边形的步骤具体为:步骤3131:选择二值布尔数组中上下左右的二值布尔值都为false的二值布尔值为设门凸包边界点;步骤3132:根据压缩比例n反标准化得到筛选后原始二值数据的设门凸包多边形。6.根据权利要求4所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于,在步骤322中,当使用数据个数作为筛选标准时:若各个设门分群二值数据的数据个数之和>原始二值数据的数据个数*0.9;或者单个设门分群二值数据的数据个数>原始二值数据的数据个数*0.85,则调节阈值并返回步骤312,重新获得设门凸包多边形,反之则为最终设门分群;当使用设门凸包多边形面积作为筛选标准时:若其中一个设门分群的凸包多边形中前向通道fsc的最大差值>另一个设门分群的凸包多边形中前向通道fsc最大差值*3,则调节阈值并返回步骤312,重新获得设门凸包多边形,反之则为最终设门分群。7.根据权利要求6所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于:所述
的调节阈值时阈值加2,并且所述的阈值不小于2,且不大于60。8.根据权利要求5或6或7所述的基于多重蛋白流式数据筛选设门分群方法,其特征在于,所述步骤4的具体步骤为:步骤41:根据最终设门分群的二值数据、原始数据及试剂盒配置信息的报告荧光通道reportx与分类荧光通道classifyy,得到报告荧光通道reportx与分类荧光通道classifyy的二值数据;步骤42:计算分类荧光通道classifyy数据的峰谷,取峰谷作为分类凸包多边形二值数据的classifyy值;步骤43:根据分类凸包多边形二值数据的classifyy值对报告荧光通道reportx与分类荧光通道classifyy的二值数据进行分群;步骤44:对各个分群的二值数据采用优化后的3σ原则剔除偏离数据,得到最终的样本文件的因子分群。9.一种基于多重蛋白流式数据筛选设门分群装置,其特征在于:包括创建实验面板单元、数据筛选单元、设门单元和统计分析单元;所述的创建实验面板单元,包括样本数据读取模块和试剂盒信息提取模块;所述样本数据读取模块,用于读取样本流式数据文件获得原始细胞采样事件矩阵;所述试剂盒信息提取模块,用于提取试剂盒配置信息获得设门分群参数;所述的数据筛选单元,包括数据预处理模块和优化3σ筛选模块;所述的数据预处理模块,根据平均值及中位数与数据分布形态的关系剔除部分无效数据,使数据更趋于正太分布;所述的优化3σ筛选模块,对要处理的数据去除最大值最小值后用中位数替换传统的3σ原则的平均值进行计算,剔除偏离数据;设门单元,对筛选后的数据进行设门分群,并对分群后的数据进行判断得到最优化的设门分群,再进行因子分群得到样本文件的因子分群;统计分析单元,包括统计单元,所述统计单元用于统计计算因子微球个数及平均荧光强度。10.根据权利要求9所述的基于多重蛋白流式数据筛选设门分群装置,其特征在于:所述创建实验面板单元还包括标准曲线设置模块,所述标准曲线设置模块,设置流式实验的标准样本的浓度、稀释倍数等信息;和/或所述的统计分析单元还包括标准曲线拟合模块,所述标准曲线拟合模块采用数据取对数的四参数但不限于数据取对数的四参数拟合。

技术总结
本发明公开了基于多重蛋白流式数据筛选设门分群方法、装置。本方法包括如下步骤:读取样本流式数据文件和相应的试剂盒配置信息,得到原始数据和设门分群参数;所述原始数据为样本文件的所有细胞采样事件矩阵;获取设门通道坐标下的原始二值数据并两次筛分后去除无效数据得到筛分后设门通道数据;获取设门凸包多边形和分群数据;获得设门分群后报告荧光通道ReportX与分类荧光通道ClassifyY的二值数据并进行分群,得到样本文件的因子分群;对样本文件的因子分群数据进行统计计算,得到因子微球个数及平均荧光强度。本发明可以自动对多重蛋白流式数据进行预处理及筛选,去除杂质数据,更精准地保留有效数据,对筛选数据进行自动设门分群,统计分析得到结果。统计分析得到结果。统计分析得到结果。


技术研发人员:刘妍
受保护的技术使用者:上海新点生物科技有限公司
技术研发日:2023.05.17
技术公布日:2023/8/28
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐