91学术服务平台

您好,欢迎来到91学术官网!站长邮箱:91xszz@sina.com

发布论文

论文咨询

探析基于C语言模拟计算的cdPCR最佳反应通孔数

  2020-05-05    198  上传者:管理员

摘要:利用C语言能够模拟芯片数字PCR中目的核酸(或目标粒子)进入反应通孔的计算过程,从而可以对检测目的核酸的最佳反应通孔数、目的核酸分布均匀性、干扰粒子对目的核酸分布的影响等问题进行分析与计算。结果表明:(1)检测目标粒子的最佳反应通孔数与目标粒子数之比为8∶1或9∶1;(3)当目标粒子数为1000时,最佳反应通孔数为8000或9000,而对应的目标粒子分布均匀性为94.0%或94.6%;(2)无论有无干扰粒子或其存在多少,目标粒子都将具有基本相同的N-Y(入洞总数-出现次数)曲线分布。因而C语言的统计分析既能为数字PCR的芯片设计提供准确的参数依据与理论指导,又能方便、快捷地完成对任一随机过程的模拟计算。

  • 关键词:
  • cdPCR
  • C语言
  • 分布均匀性
  • 反应通孔数
  • 目标粒子
  • 统计涨落
  • 加入收藏

C语言是面向过程的高级程序设计语言[1,2,3,4,5,6],具有功能强大、应用面广、使用简单方便、可移植性好等优点[2,3,4]。C语言不仅可以用于系统软件编写、单片机系统开发,还可以用于大数据统计与分析[3,4,7,8]。数字PCR(dgitalPCR,dPCR)是一种核酸分子绝对定量技术[9,10,11,12],其不需要采用看家基因或标准曲线,具有高灵敏度、高准确性、高耐受性、绝对定量等优点[13,14,15,16,22]。dPCR主要包括液滴数字PCR(ddPCR)和芯片数字PCR(cdPCR)两种,其中cdPCR通过把反应液均匀分到芯片上的反应通孔中进行PCR反应,然后根据泊松分布和荧光信号阳性比例来计算目的核酸的拷贝数[13]。

利用C语言程序来模拟芯片数字PCR中目的核酸进入反应通孔的过程,从而可以对干扰粒子对目的核酸分布的影响[17,18,19,20]、目的核酸最佳反应通孔数、目的核酸分布均匀性等问题进行分析与计算,旨在为数字PCR的芯片设计提供一定的参数依据与理论指导。


1、模拟分析算法


通过C语言模拟“干扰作用完全随机的情况下目标粒子进入反应通孔的过程”的模拟算法如图1所示,具体过程如下:

(1)在[0,h+n*h/m)区间内生成m+n个随机数,其中[0,h-1]区间内的随机数代表目标粒子,总数为m;[h,h+n*h/m)区间内的随机数代表干扰粒子,总数为n;h代表反应通孔数;

(2)统计[0,h-1]内非重复随机数的总数N,N表示m个目标粒子在h个反应通孔中的入孔总数;

(3)将上述过程重复K次,并统计不同N对应的出现次数Y;

(4)根据不同h对应的N-Y曲线的重叠度或N-Y主峰N值随h的变化率来判断最佳反应通孔数。


2、无干扰的最佳反应通孔数


在没有干扰粒子的情况下(n=0),为了分析目的核酸(或目标粒子)在检测芯片反应通孔内的分布情况,根据图1所示采用如下统计过程:

图1模拟算法程序图

设目标粒子个数m为1000,反应通孔个数h为1000a(a取1到10的所有整数)。当反应通孔数为1000时(a=1),利用C算法程序随机生成1000个介于[0,999]的随机数,代表1000个目标粒子。当生成随机数x(0≤x≤999)时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复数值的总数N,N就表示1000个目标粒子在1000个反应通孔中的入洞总数。将上述过程重复20万次,统计不同入洞总数N对应的出现次数Y,从而得到1000个目标粒子在1000个反应通孔中的分布情况,如图2所示,其入洞总数非零区间为[589,674],其中当入洞总数N=632时出现次数最大。

图21000个目标粒子在1000个反应通孔中的分布

当反应通孔数为2000时(a=2),利用C算法程序随机生成1000个介于[0,1999]的随机数,当生成随机数x(0≤x≤999)时表示目标粒子落入标号为x的反应通孔内,并统计1000个随机数的非重复数值的总数N。将上述过程重复20万次,统计不同入洞总数N对应的出现次数Y,从而得到1000个目标粒子在2000个反应通孔中的分布情况,如图3所示,其入洞总数非零区间为[745,829],其中当入洞总数N=787时出现次数最大。

依此类推,可以得到当反应通孔数为1000a时(a分别为3到10的整数)1000个目标粒子的分布情况,见图4。

对应图4,各曲线波峰对应的入洞总数N见表1,而由表1得到的曲线点图见图5。

图31000个目标粒子在2000个反应通孔中的分布

图41000个目标粒子在1000a(a为从1到10的全部整数)个反应通孔中的分布

表1N-Y曲线波峰对应的入洞总数N

从图4发现,随着芯片反应通孔数的增多,1000个目标粒子的入洞总数N也越来越大,即1000个目标粒子的分布均匀度越来越高,但随着反应通孔数的进一步增多,不同反应通孔数对应的N-Y曲线的毗邻程度越来越高,重叠程度也越来越大;而表1和图5同样表明,虽然随着反应通孔数的增加目标粒子的分布均匀度会越来越高,但当反应通孔数大于某一值时分布均匀度的提高已开始趋于饱和(增加非常平缓)。因此,为提高目标粒子在反应通孔中的分布均匀度,直接有效的方法是增加芯片上的反应通孔数,但当芯片反应通孔数大于等于8000或9000时反应通孔数增加对提高目标粒子分布均匀度的作用将趋于饱和,如果继续增加反应通孔数,则将带来工艺难度的提升与设计成本的增加,特对是对于目的核酸片段较少、检测灵敏度要求不高的实验,高昂PCR仪显然与实际需求相违背。所以,在1000个目标粒子的基础上,cdPCR检测芯片的最佳反应通孔数应为8000或9000,并由此推断,在无干扰粒子的情况下,不论目标粒子个数m取多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比应为8∶1或9∶1。

图5表1数据对应的点线图


3、含干扰的最佳反应通孔数


3.1干扰粒子对目标粒子分布的影响

文献[21]分析了干扰作用完全随机的情况下,干扰粒子有无及其多少对目标粒子分布的影响,并得到了1000个目标粒子在1000b个(b分别取0、10、100、1000、10000)干扰粒子作用下分别在1000、3000、7000个反应通孔中的分布情况[21],分别见图6、图7与图8,其中图6~图8的(a)表示无干扰粒子对应的目标粒子分布;图6~图8的(b)、(c)、(d)、(e)分别对应干扰粒子个数是目标粒子的10、100、1000、10000倍的目标粒子分布;图6~图8的(e)为前述5类情况的合成图。文献[21]得到结论如下:

不论反应通孔数h取多少,含干扰粒子与不含干扰粒子的5类N-Y曲线分布基本重合或相同,且干扰粒子个数越小,含干扰粒子的N-Y曲线分布与不含干扰粒子的N-Y曲线分布就具有越高的重合度或相似度。上述结果表明,在干扰作用完全随机的情况下,对于任意取值的反应通孔数h,干扰粒子有无及其多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布都基本相同。

图6目标粒子在1000个反应通孔中的分布

3.2分析结果

分析表明,在干扰作用完全随机的情况下,对于任意取值的反应通孔数h,干扰粒子有无或其多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布[21]都将基本相同。因此,“含干扰的最佳反应通孔数”与“无干扰的最佳反应通孔数”应该几乎一致,故仍可将含干扰粒子的最佳反应通孔数定为8000或9000(目标粒子个数为1000的情况下),并由此推断,在含干扰粒子的情况下,不论目标粒子个数m取多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比仍为8∶1或9∶1。

图7目标粒子在3000个反应通孔中的分布

图8目标粒子在7000个反应通孔中的分布


4、目标粒子分布的均匀性


目标粒子分布的均匀性定义为“含目标粒子的反应通孔数”与“目标粒子总数”的百分比。为了分析目标粒子在不同反应通孔数下的分布均匀性,采用如下统计方法:

设目标粒子个数为1000,反应通孔数h为1000a(a取1到200的任一整数)。利用C算法程序随机生成1000个介于[0,1000a-1]的随机数,代表1000个目标粒子。当生成随机数x(0≤x≤1000a-1)时表示目标粒子落入标号为x的反应通孔内,统计1000个随机数的非重复数值的总数N,N就表示1000个目标粒子在1000a个反应通孔中的入洞总数。将上述模拟过程重复5万次,并计算入洞总数N的平均值,该平均值即“含目标粒子的反应通孔数”,再用其除以“目标粒子总数”,从而得到1000个目标粒子在1000a个反应通孔中的分布均匀性,具体模拟计算结果见表2。

表2目标粒子分布均匀性

依据上述结果,可以得到最佳反应通孔数8000或9000对应的目标粒子分布均匀性为94.0%或94.6%;同时根据上述方法,可以得到满足指定要求的分布均匀性对应的最低反应通孔数,从而为cdPCR的芯片设计提供了理论参数指导。另外,由表2同样可以发现,随反应通孔数的增多目标粒子分布均匀性逐渐增大,但当反应通孔数大于某值时,分布均匀性的增加将变得愈发缓慢(增速低于1%)并逐渐趋于饱和,由此同样可以得出最佳反应通孔数应为8000或9000的结论。


5、总结


利用C语言模拟了芯片数字PCR中目的核酸进入反应通孔的计算过程,并对cdPCR中干扰粒子对目的核酸分布的影响、检测目的核酸的最佳反应通孔数、目的核酸分布均匀性等问题进行了分析与计算,得到如下结论:

(1)在干扰作用完全随机的情况下,对于任意取值的反应通孔数,干扰粒子有无或其存在多少均不会破坏目标粒子的随机分布程度,因此,无论有无干扰粒子或其存在多少,目标粒子的N-Y曲线分布都将基本相同。

(2)在干扰作用完全随机的情况下,对于任意取值的反应通孔数,无论有无干扰粒子或其存在多少,检测目标粒子的最佳反应通孔数与目标粒子个数之比都应为8∶1或9∶1。

(3)当目标粒子个数为1000时检测目标粒子的最佳反应通孔数为8000或9000,而对应的目标粒子分布均匀性为94.0%或94.6%。


参考文献:

[1]范华,秦茂玲,张俊.透视C程序设计语言[J].计算机技术与发展,2008,18(6):64-66.

[2]谭浩强.C程序设计[M].4版.北京:清华大学出版社,2010.

[3]KernighanBW,RitchieDM.C程序设计语言[M].2版.徐宝文,译.北京:机械工业出版社,2005.

[4]ReekKA.POINTERSONC[M].徐波,译.北京:人民邮电出版社,2003.

[5]谭浩强.汇编语言与C语言的混合程序设计技术[J].计算机技术与发展,2006,16(8):18-20.

[6]侯昌昌,朱玉龙.汇编语言与C语言在编程中的交叉应用[J].安徽工业大学学报,2003,20(2):148-151.

[7]倪瑞晓.C语言编程技术的分析研究[J].计算机技术与发展,2009,19(12):251-254.

[8]朱进.面向对象设计模式的C语言实现[M].计算机技术与发展,2005,15(11):99-101.

[10]林彩琴,姚波.数字PCR技术进展[J].化学进展,2012,24(12):2415-2423.

[21]周德良.基于C语言模拟计算的粒子扰动机制分析[J].佳木斯大学学报,2018,36(6):984-989.

[22]马金柱,李军,王北艳,等.牛CD18编码全基因特异引物设计与PCR扩增[J].黑龙江八一农垦大学学报,2006,18(3):59-60.


周德良.基于C语言模拟计算的cdPCR最佳反应通孔数分析[J].黑龙江八一农垦大学学报,2020,32(02):91-96+118.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

计算机应用与软件

期刊名称:计算机应用与软件

期刊人气:3662

期刊详情

主管单位:上海市科学院

主办单位:上海市计算技术研究所,上海计算机软件技术开心中心

出版地方:上海

专业分类:计算机

国际刊号:1000-386X

国内刊号:31-1260/TP

邮发代号:4-379

创刊时间:1984年

发行周期:月刊

期刊开本:大16开

见刊时间:一年半以上

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定