ADNA中蕴藏着丰富的信息,但当前的技术限制了科学家对遗传学、表观遗传学和基因表达的探索。现代测序技术通常一次分析一个组,这减少了研究人员可以提出的问题数量以及他们从样本中获得的信息。这导致他们的研究主题不完整。相反,研究人员寻求新方法来共同表征多种生物学模式,以获得更全面的信息。
测序限制
遗传学和表观遗传学齐头并进。遗传改变可以影响DNA甲基化,表观遗传标记在控制基因表达中发挥重要作用。1此外,甲基化模式的变化会影响许多疾病,包括各种癌症、自身免疫性疾病、代谢疾病和神经系统疾病。2,3因此,分析基因组和表观基因组对于获得细胞功能的完整图像至关重要。例如,在一项探索衰老和癌症的研究中,研究人员发现,与单独的遗传或DNA甲基化数据相比,分析体细胞基因突变和DNA甲基化可以更准确地预测一个人的亡率。4
下一代测序(NGS)短读长测序仪仅测量四种碱基:腺嘌呤、鸟嘌呤、胞嘧啶和胸腺嘧啶,忽略了重要的DNA修饰。胱氨酸甲基化产生5-甲基胞嘧啶(5mC),通常会关闭基因表达。一系列反应消除甲基化,通常会诱导基因表达,首先将5mC转化为5-羟甲基胞嘧啶(5hmC)。因此,识别DNA样本中的5mC和5hmC为了解染色质可用性、增强子状态和基因表达提供了重要信息。然而,亚硫酸氢盐测序等表观遗传学分析只能区分未甲基化胞嘧啶和甲基化胞嘧啶(5mC和/或5hmC),通常会限制胞嘧啶对胸腺嘧啶突变的检测,胸腺嘧啶突变是哺乳动物基因组和癌症中最常见的突变。5,6区分5mC和5hmC的方法通常涉及单独、并行的工作流程,这使研究进展变得复杂并减慢。
生物模态
在不同仪器上运行的多组学研究需要大量样本,成本高昂,并且依赖于数据集之间的相关性。为了满足简化的多模式工作流程的需求,biomodal开发了一种使用duetevoC测量和分析基因组和甲基化组的单一解决方案。7duetevoC采用酶促过程,在发夹结构上复制每条DNA链。这在原始链上保留了两种类型的胱氨酸修饰,以供以后的表观遗传分析。duetevoC与短读长测序仪兼容,该过程高效且避免降解,使研究人员能够使用少至5ng的DNA样本。
测序后,二重奏专有软件会比对和比较原始链和复制链的序列信息,计算具有遗传和表观遗传信息的解析碱基。这使得研究人员能够对所有四个DNA碱基进行测序并区分5mC和5hmC。使用数据分析包,研究人员可以获得单个多组学数据集,从中可以评估遗传变异和甲基化图谱,同时还可以预测同一低输入DNA样本中的染色质可及性、基因表达和增强子状态。
通过研究遗传学和表观遗传学的相互作用,研究人员可以发现疾病生物标志物,更好地了解功能基因组学,并确定癌症、神经退行性疾病、衰老等领域的新治疗靶点。