基于单细胞转录组的拷贝数变异识别文献综述

 2023-08-15 18:01:10

文献综述(或调研报告):

测序技术的发展:

起初,对于基因序列的测定依赖于基于生化方法和电泳技术的Sanger测序。在此基础上,结合荧光标记手段和毛细管电泳技术,形成了测序过程的自动化,即第一代测序技术。但受当时技术条件的制约,第一代测序技术成本高以及低通量的问题无法解决。随之而来的第二代测序技术则实现了测序通量的快速增长。第二代测序技术主要包括了454测序平台、Solexa平台以及SOLiD平台,主要基于循环阵列合成技术,通过边合成边测序实现了高通量的自动化测序。但高通量测序也存在着一些问题,如基于普遍使用的基于PCR的扩增方法在扩增反应中存在的偏向性会使得部分碱基区域过度扩增,造成后续分析过程的偏差。为了解决扩增反应对测序带来的影响,通过使用纳米技术和现代光学等技术而不借助生化方法直接识别碱基的第三代测序技术出现。当样本核酸含量达到测序仪要求时,可不进行核酸的扩增,直接进行文库制备,并进行自动化测序。

单细胞转录组测序技术:

单细胞全转录组测序技术是在单细胞水平上对细胞全转录组进行测序的技术,其基本原理是将通过微流控等手段分离的单细胞中的微量转录组RNA进行逆转录及扩增后进行高通量测序。单细胞测序与传统的组织测序不同,其测序对象是单个细胞,而非来自多个细胞。尽管由于测序样本核酸过于微量,需要进行随机扩增,对测序质量产生影响,但单细胞测序技术仍然有着显著的优点。例如:组织测序的测序结果是组织细胞的平均水平,仅能表现出细胞群体的特征;而单细胞测序的测序结果是针对单个细胞而言的,可以识别出单个细胞基因组的改变,如本课题所研究的CNV,在肿瘤内异质性等研究方向上起着重要的作用。

拷贝数变异:

拷贝数变异是指在人类基因组中广泛存在的从千碱基到数百万碱基范围的插入缺失和复杂多位点的变异,与SNP同为人类表型变异的两大重要潜在来源。拷贝数的多态性与许多复杂疾病有关,包括系统性红斑狼疮等自身免疫性疾病。但与SNP不同,CNV的检测难度较大,尤其短序列的CNVs受限于测序及分析技术很难检测到,因而更高敏感性和精确性的检测技术需求较高。

拷贝数变异的检测方法:

目前主流的拷贝数变异检测方法是基于全基因组二代测序的CNV检测方法。其原理主要是将测序产生的短序列比对到参考基因组上,基于比对的结果对全基因组上的CNV进行识别。根据检测策略的不同,又分为双末端比对法,剪切比对法以及测序片段深度法等多种方法,其中测序片段深度法使用较为普遍,基本原理是将全基因组划为小的窗口,将每个窗口内的平均拷贝数水平与其他窗口进行比较,通过统计算法判断窗口内是否存在拷贝数变异。但实际上,由于实验及算法的局限性,已发表的不同研究之间重合的CNVs仅有25%-45%。即使应用不同算法对同一样本进行检测,也仅有不足80%的重合率,这说明CNV检测方法仍有较大的改进空间。

目前研究较多的是基于DNA序列的CNV检测方法,也存在使用DNA和RNA数据整合分析拷贝数变异的方法,但独立使用RNA数据进行CNV检测的发展时间尚不长。最早于2014年Itay Tirosh等人在研究原发性胶质母细胞瘤的肿瘤内异质性时提出了通过单细胞转录组数据分析CNV的基本流程,即利用滑窗基于基因平均表达量估计CNV,并于2016年和2017年将流程逐步改进完善。基于这些早期研究,inferCNV开发完成,同时也将HMM算法以及贝叶斯混合模型引入CNV检测当中,但该软件仅能提供可视化的谱图。2018年,Jean Fan等人设计了一种称为HoneyBADGER的计算方法,并且整合了基因组上等位基因杂合性丢失的信息,提高了识别拷贝数变异的准确性。同年,Akdes Serin Harmanci提出一种新的信号处理方法,更高效的直接从测序数据中获取等位基因移位信号测量杂合度缺失,以多标度分辨率对不同长度范围的CNV进行识别。除了独立通过单细胞转录组数据分析CNV,clonealign、CONICS等工具也开始将DNA数据与RNA数据进行整合分析检测CNV,一定程度上提高识别的准确度。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。