2020-05-05
198
上传者:管理员
摘要:利用C语言能够模拟芯片数字PCR中目的核酸(或目标粒子)进入反应通孔的计算过程,从而可以对检测目的核酸的最佳反应通孔数、目的核酸分布均匀性、干扰粒子对目的核酸分布的影响等问题进行分析与计算。结果表明:(1)检测目标粒子的最佳反应通孔数与目标粒子数之比为8∶1或9∶1;(3)当目标粒子数为1000时,最佳反应通孔数为8000或9000,而对应的目标粒子分布均匀性为94.0%或94.6%;(2)无论有无干扰粒子或其存在多少,目标粒子都将具有基本相同的N-Y(入洞总数-出现次数)曲线分布。因而C语言的统计分析既能为数字PCR的芯片设计提供准确的参数依据与理论指导,又能方便、快捷地完成对任一随机过程的模拟计算。
加入收藏
C语言是面向过程的高级程序设计语言[1,2,3,4,5,6],具有功能强大、应用面广、使用简单方便、可移植性好等优点[2,3,4]。C语言不仅可以用于系统软件编写、单片机系统开发,还可以用于大数据统计与分析[3,4,7,8]。数字PCR(dgitalPCR,dPCR)是一种核酸分子绝对定量技术[9,10,11,12],其不需要采用看家基因或标准曲线,具有高灵敏度、高准确性、高耐受性、绝对定量等优点[13,14,15,16,22]。dPCR主要包括液滴数字PCR(ddPCR)和芯片数字PCR(cdPCR)两种,其中cdPCR通过把反应液均匀分到芯片上的反应通孔中进行PCR反应,然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数[13]。
利用C语言程序来模拟芯片数字PCR中目的核酸进入反应通孔的过程,从而可以对干扰粒子对目的核酸分布的影响[17,18,19,20]、目的核酸最佳反应通孔数、目的核酸分布均匀性等问题进行分析与计算,旨在为数字PCR的芯片设计提供一定的参数依据与理论指导。
1、模拟分析算法
通过C语言模拟“干扰作用完全随机的情况下目标粒子进入反应通孔的过程”的模拟算法如图1所示,具体过程如下:
(1)在[0,h+n*h/m)区间内生成m+n个随机数,其中[0,h-1]区间内的随机数代表目标粒子,总数为m;[h,h+n*h/m)区间内的随机数代表干扰粒子,总数为n;h代表反应通孔数;
(2)统计[0,h-1]内非重复随机数的总数N,N表示m个目标粒子在h个反应通孔中的入孔总数;
(3)将上述过程重复K次,并统计不同N对应的出现次数Y;
(4)根据不同h对应的N-Y曲线的重叠度或N-Y主峰N值随h的变化率来判断最佳反应通孔数。
2、无干扰的最佳反应通孔数
在没有干扰粒子的情况下(n=0),为了分析目的核酸(或目标粒子)在检测芯片反应通孔内的分布情况,根据图1所示采用如下统计过程:
图1模拟算法程序图
设目标粒子个数m为1000,反应通孔个数h为1000a(a取1到10的所有整数)。当反应通孔数为1000时(a=1),利用C算法程序随机生成1000个介于[0,999]的随机数,代表1000个目标粒子。当生成随机数x(0≤x≤999)时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复数值的总数N,N就表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次,统计不同入洞总数N对应的出现次数Y,从而得到1000个目标粒子在1000个反应通孔中的分布情况,如图2所示,其入洞总数非零区间为[589,674],其中当入洞总数N=632时出现次数最大。
图21000个目标粒子在1000个反应通孔中的分布
当反应通孔数为2000时(a=2),利用C算法程序随机生成1000个介于[0,1999]的随机数,当生成随机数x(0≤x≤999)时表示目标粒子落入标号为x的反应通孔内,并统计1000个随机数的非重复数值的总数N。将上述过程重复20万次,统计不同入洞总数N对应的出现次数Y,从而得到1000个目标粒子在2000个反应通孔中的分布情况,如图3所示,其入洞总数非零区间为[745,829],其中当入洞总数N=787时出现次数最大。
依此类推,可以得到当反应通孔数为1000a时(a分别为3到10的整数)1000个目标粒子的分布情况,见图4。
对应图4,各曲线波峰对应的入洞总数N见表1,而由表1得到的曲线点图见图5。
图31000个目标粒子在2000个反应通孔中的分布
图41000个目标粒子在1000a(a为从1到10的全部整数)个反应通孔中的分布
表1N-Y曲线波峰对应的入洞总数N
从图4发现,随着芯片反应通孔数的增多,1000个目标粒子的入洞总数N也越来越大,即1000个目标粒子的分布均匀度越来越高,但随着反应通孔数的进一步增多,不同反应通孔数对应的N-Y曲线的毗邻程度越来越高,重叠程度也越来越大;而表1和图5同样表明,虽然随着反应通孔数的增加目标粒子的分布均匀度会越来越高,但当反应通孔数大于某一值时分布均匀度的提高已开始趋于饱和(增加非常平缓)。因此,为提高目标粒子在反应通孔中的分布均匀度,直接有效的方法是增加芯片上的反应通孔数,但当芯片反应通孔数大于等于8000或9000时反应通孔数增加对提高目标粒子分布均匀度的作用将趋于饱和,如果继续增加反应通孔数,则将带来工艺难度的提升与设计成本的增加,特对是对于目的核酸片段较少、检测灵敏度要求不高的实验,高昂PCR仪显然与实际需求相违背。所以,在1000个目标粒子的基础上,cdPCR检测芯片的最佳反应通孔数应为8000或9000,并由此推断,在无干扰粒子的情况下,不论目标粒子个数m取多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比应为8∶1或9∶1。
图5表1数据对应的点线图
3、含干扰的最佳反应通孔数
3.1干扰粒子对目标粒子分布的影响
文献[21]分析了干扰作用完全随机的情况下,干扰粒子有无及其多少对目标粒子分布的影响,并得到了1000个目标粒子在1000b个(b分别取0、10、100、1000、10000)干扰粒子作用下分别在1000、3000、7000个反应通孔中的分布情况[21],分别见图6、图7与图8,其中图6~图8的(a)表示无干扰粒子对应的目标粒子分布;图6~图8的(b)、(c)、(d)、(e)分别对应干扰粒子个数是目标粒子的10、100、1000、10000倍的目标粒子分布;图6~图8的(e)为前述5类情况的合成图。文献[21]得到结论如下:
不论反应通孔数h取多少,含干扰粒子与不含干扰粒子的5类N-Y曲线分布基本重合或相同,且干扰粒子个数越小,含干扰粒子的N-Y曲线分布与不含干扰粒子的N-Y曲线分布就具有越高的重合度或相似度。上述结果表明,在干扰作用完全随机的情况下,对于任意取值的反应通孔数h,干扰粒子有无及其多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布都基本相同。
图6目标粒子在1000个反应通孔中的分布
3.2分析结果
分析表明,在干扰作用完全随机的情况下,对于任意取值的反应通孔数h,干扰粒子有无或其多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布[21]都将基本相同。因此,“含干扰的最佳反应通孔数”与“无干扰的最佳反应通孔数”应该几乎一致,故仍可将含干扰粒子的最佳反应通孔数定为8000或9000(目标粒子个数为1000的情况下),并由此推断,在含干扰粒子的情况下,不论目标粒子个数m取多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比仍为8∶1或9∶1。
图7目标粒子在3000个反应通孔中的分布
图8目标粒子在7000个反应通孔中的分布
4、目标粒子分布的均匀性
目标粒子分布的均匀性定义为“含目标粒子的反应通孔数”与“目标粒子总数”的百分比。为了分析目标粒子在不同反应通孔数下的分布均匀性,采用如下统计方法:
设目标粒子个数为1000,反应通孔数h为1000a(a取1到200的任一整数)。利用C算法程序随机生成1000个介于[0,1000a-1]的随机数,代表1000个目标粒子。当生成随机数x(0≤x≤1000a-1)时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复数值的总数N,N就表示1000个目标粒子在1000a个反应通孔中的入洞总数。将上述模拟过程重复5万次,并计算入洞总数N的平均值,该平均值即“含目标粒子的反应通孔数”,再用其除以“目标粒子总数”,从而得到1000个目标粒子在1000a个反应通孔中的分布均匀性,具体模拟计算结果见表2。
表2目标粒子分布均匀性
依据上述结果,可以得到最佳反应通孔数8000或9000对应的目标粒子分布均匀性为94.0%或94.6%;同时根据上述方法,可以得到满足指定要求的分布均匀性对应的最低反应通孔数,从而为cdPCR的芯片设计提供了理论参数指导。另外,由表2同样可以发现,随反应通孔数的增多目标粒子分布均匀性逐渐增大,但当反应通孔数大于某值时,分布均匀性的增加将变得愈发缓慢(增速低于1%)并逐渐趋于饱和,由此同样可以得出最佳反应通孔数应为8000或9000的结论。
5、总结
利用C语言模拟了芯片数字PCR中目的核酸进入反应通孔的计算过程,并对cdPCR中干扰粒子对目的核酸分布的影响、检测目的核酸的最佳反应通孔数、目的核酸分布均匀性等问题进行了分析与计算,得到如下结论:
(1)在干扰作用完全随机的情况下,对于任意取值的反应通孔数,干扰粒子有无或其存在多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布都将基本相同。
(2)在干扰作用完全随机的情况下,对于任意取值的反应通孔数,无论有无干扰粒子或其存在多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比都应为8∶1或9∶1。
(3)当目标粒子个数为1000时检测目标粒子的最佳反应通孔数为8000或9000,而对应的目标粒子分布均匀性为94.0%或94.6%。
参考文献:
[1]范华,秦茂玲,张俊.透视C程序设计语言[J].计算机技术与发展,2008,18(6):64-66.
[2]谭浩强.C程序设计[M].4版.北京:清华大学出版社,2010.
[3]KernighanBW,RitchieDM.C程序设计语言[M].2版.徐宝文,译.北京:机械工业出版社,2005.
[4]ReekKA.POINTERSONC[M].徐波,译.北京:人民邮电出版社,2003.
[5]谭浩强.汇编语言与C语言的混合程序设计技术[J].计算机技术与发展,2006,16(8):18-20.
[6]侯昌昌,朱玉龙.汇编语言与C语言在编程中的交叉应用[J].安徽工业大学学报,2003,20(2):148-151.
[7]倪瑞晓.C语言编程技术的分析研究[J].计算机技术与发展,2009,19(12):251-254.
[8]朱进.面向对象设计模式的C语言实现[M].计算机技术与发展,2005,15(11):99-101.
[10]林彩琴,姚波.数字PCR技术进展[J].化学进展,2012,24(12):2415-2423.
[21]周德良.基于C语言模拟计算的粒子扰动机制分析[J].佳木斯大学学报,2018,36(6):984-989.
[22]马金柱,李军,王北艳,等.牛CD18编码全基因特异引物设计与PCR扩增[J].黑龙江八一农垦大学学报,2006,18(3):59-60.
周德良.基于C语言模拟计算的cdPCR最佳反应通孔数分析[J].黑龙江八一农垦大学学报,2020,32(02):91-96+118.
分享:
脑机接口(brain-computer interfaces,BCI)旨在为大脑和外部设备(计算机或其他电子设备)之间建立直接通信,而不依赖于任何肌肉或外周神经.BCI技术的应用有助于患有肌萎缩性侧索硬化、脑卒中、脑瘫、脊髓损伤等“闭锁综合征”的病患恢复日常交流和生活的能力.
2024-12-07随着我国公路建设的蓬勃发展,高速公路的隧道数量持续增加。当前,我国高速公路隧道主要采用人工巡检方式。尽管这种方式具有一定的便利性,如设备操作简单、巡检流程灵活以及问题处理及时等,但在实践中却面临诸多挑战。由于隧道内车流密集、空间有限且环境质量较差,使设备的日常维护和事故排查工作变得异常困难。
2024-10-14随着高速公路网络的日益庞大,其运营管理和维护保养工作也面临着前所未有的挑战,特别是在隧道等复杂路段,由于其特殊的环境和构造,安全问题尤为突出。因此,利用先进的技术手段,提高隧道的巡检效率和质量,已成为当前高速公路管理领域亟待解决的问题。传统的隧道巡检主要依赖人工完成。
2024-10-14随着建筑行业的快速发展,电梯的安装质量直接关系到乘客的生命安全。因此,对电梯安装质量的检测有重要意义。传统的电梯安装质量检测方法依赖于人工目视检查和简单的工具测量,容易受到人为因素和环境因素的影响,难以保证检测的准确性和可靠性。本研究旨在探讨计算机视觉技术在电梯安装质量检测中的应用,通过分析电梯安装质量检测的特点和需求。
2024-06-25在数字化时代,电力企业面临巨大挑战和机遇[1]。客户需求激增,市场竞争激烈,迫使电力企业寻求创新和改进[2]。为应对这一挑战,基于Hadoop大数据框架的电力智能客服辅助决策系统成为解决方案,助力电力企业提升客户服务质量和运营效率[3]。
2024-06-06目前,中药饮片的识别分类方法主要还停留在人工阶段,需要大量的专业人才,费时费力。随着科学技术的进步,利用计算机视觉技术进行中药饮片的识别是未来社会的发展趋势[1]。随着人工智能技术的不断发展,它给各行各业的发展带来了日新月异的变化[2]。通过神经网络提取中药饮片的特征参数,建立识别分类模型进行分析,使得中药饮片识别也变得不再那么困难。
2024-01-17ChatGPT全称是Chat Generative Pre-trained Transformer, 是OpenAI公司于2022年11月发布的一款聊天机器人程序。ChatGPT能根据用户提出的问题,经人工标注数据集训练的算法智能生成回答内容,而不仅仅只是加工现有内容。它能够像人类一样自然地进行对话,并且具备完成各种任务的能力,包括邮件撰写、视频脚本创作、文案编写、翻译以及代码生成等。
2024-01-16汉字的结构复杂、形态多样,每个汉字都具有结构的唯一性,汉字骨架作为汉字字形的重要拓扑描述具有重要意义。汉字骨架生成广泛应用于字形技术[1]、汉字识别[2]、汉字生成[3]等汉字信息处理领域。汉字骨架可由一段书写序列进行表示,与图像表示相比,序列格式的汉字骨架包含更多的动态信息,如时间顺序、轨迹等,这些信息对汉字的笔画连接、拓扑结构等有更为清晰的描述,同时书写序列可以很容易地转换为图像[4]。
2024-01-03图像融合是信息融合的一个分支。红外传感器抗干扰能力强,但其空间分辨率较低,缺少纹理细节。可见光图像具有更多细节信息和高分辨率,但在光照很弱或物体被遮挡的情况下效果不好[1]。为了利用可见光和红外图像的互补信息,红外和可见光图像融合非常必要,现已广泛应用于众多领域中[2]。
2024-01-03国际石油勘验领域由于受行业划分的缘故,各系统之间难以兼容,使井场内部形成了一个个的信息孤岛。为了实现不同施工主体之间数据信息的兼容共享与远程控制,甲方在招投标合同及其澄清中明确地规定了乙方必须能够提供WITSML(Well Site Information Transfer Standard Markup Language,井场信息传输标准标记语言)数据流。
2023-09-25人气:5473
人气:5211
人气:4388
人气:3394
人气:3119
我要评论
期刊名称:计算机应用与软件
期刊人气:3662
主管单位:上海市科学院
主办单位:上海市计算技术研究所,上海计算机软件技术开心中心
出版地方:上海
专业分类:计算机
国际刊号:1000-386X
国内刊号:31-1260/TP
邮发代号:4-379
创刊时间:1984年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:1.079
影响因子:0.408
影响因子:0.260
影响因子:0.727
影响因子:0.489
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!