BG视讯

国家生物信息中心相助展现并校正多组学数据中的细胞周期滋扰效应

在多组学(Multi-Omics)研究日益成为剖析生命历程主要手段的今天 ,我们是否真正捕获到了数据背后的“生物学实质”  ?细胞周期 ,这一在经典生物学中早已被普遍认知的基本历程 ,在多组学剖析中却往往被看成配景因素忽略。然而 ,细胞周期的异质性 ,尤其是差别细胞类型间细胞周期结构的差别 ,滋扰了我们对组学数据的解读 ,导致差别信号的伪阳性 ,掩饰了真正具有生物学意义的发明。

5月28日 ,国家生物信息中心蔡军团队联合中国农业科学院北京牧医所郑彩宏研究员团队 ,在Advanced Science?在线揭晓了题为“Mitigating Cell Cycle Effects in Multi-Omics Data: Solutions and Analytical Frameworks”的研究论文。该研究以干细胞与分解细胞为模子 ,系统梳理了细胞周期结构差别对多组学数据诠释的全局性影响 ,构建了一套针对差别组学类型的通用剖析框架 ,为怎样判断高增殖细胞群体中真实的生物学信号提供了科学依据和手艺路径。

在干细胞研究、胚胎发育及肿瘤等增殖活跃的生物学场景中 ,细胞周期结构的差别是组学数据解读误差的主要泉源之一。研究指出 ,当样本中处于S期的细胞比例凌驾38%时 ,DNA的非同步复制会影响拷贝数变异的识别 ,导致高假阳性率。对此 ,研究团队引入复制时序域(Replication Timing Domain ,RTD)校正 ,可以显著降低拷贝数变异判断的假阳性。

不但云云 ,细胞周期也影响了染色质可及性和DNA甲基化的识别精度。研究发明 ,S期特异的染色质开放区域(open chromatin regions ,OCRs)更富集于早期RTD区域 ,并且与OCRs关联的假阳性拷贝数变异区域倾向于更高比例拷贝数扩增 ,同时 ,细胞周期差别阶段共有的OCRs ,往往具有更高的转录活性关联性与调控功效。别的 ,差别甲基化区域的识别准确性也受到细胞周期的影响。通过整合转录组数据 ,研究进一步批注 ,相较于直接较量 ,基于细胞周期分型后举行自力较量的战略,更有助于展现潜在的生物学信号。 在单细胞转录组层面 ,只管现在已有多种单细胞剖析要领试图消除细胞周期的滋扰 ,但这些要领往往缺乏以彻底剥离细胞周期变量对差别表达基因识别的影响。通过对多种细胞周期分类工具的较量 ,研究最终选定了分类准确性较高的Cyclone算法 ,并在此基础上构建“phase comparison”战略 ,有用提升差别表达基因的生物学相关性和功效注释精度。

基于此 ,研究团队系统评估了细胞周期在多组学剖析中的滋扰效应 ,并针对差别数据类型提出相识决战略 ,主要包括:通过RTD校正降低高S期比例群体中的CNV假阳性 ,优化甲基化与转录组剖析流程。连系Cyclone算法与“phase comparison”要领 ,有用提升单细胞数据中差别基因的识别准确性。团队通过模拟数据、生物学实验和功效注释等多维手段 ,系统验证了战略的有用性。

综上所述 ,研究团队展现了细胞周期这一“被忽略的主要变量” ,在多组学解读中的要害作用。通过将细胞周期明确纳入剖析流程 ,提升了组学数据的诠释准确性 ,为干细胞及肿瘤等高增殖配景下的精准剖析提供了研究范式。

该研究获得了北京市自然科学基金重点研究专题课题、BG视讯要害焦点手艺攻坚先导专项、BG视讯前瞻战略科技先导专项等项目资助。国家生物信息中心蔡军研究员、中国农业科学院北京牧医所郑彩宏研究员为本文的配合通讯作者。国家生物信息中心博士生聂瑞与北京牧医所郑彩宏研究员为本文的配合第一作者。

BG视讯·大游(集团)官方网站

细胞周期对多组学影响及校正示意图

论文链接


附件下载:
【网站地图】【sitemap】