北京基因组所(国家生物信息中心)组学原始数据归档库GSA实现与NCBI SRA数据库的数据整合
克日,在国际核酸序列数据库相助同盟(INSDC)的支持和美国国家生物信息手艺中心(NCBI)的手艺协助下,BG视讯(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)完成NCBI生物项目治理数据库(BioProject)、生物样本治理数据库(BioSample)所有数据及序列片断归档库(Sequence Read Archive, SRA)所有元数据与自主开发数据库的整合,实现了上述数据在NGDC网站的一站式检索与会见,极大提升了海内科研职员盘问和获取数据的效率。
CNCB-NGDC 2015年开发的组学原始数据归档库(Genome Sequence Archive, GSA)是中国首个测序数据归档系统,已完成NCBI SRA所有元数据及2022年4月20日起SRA日更新全量数据(元数据和原始序列数据)的整合。阻止5月28日,GSA收录460万测序数据集,涵盖近2000万实验数据和2074多万测序反应,测序序列数据量凌驾13PB。特殊指出的是,GSA现在提供NCBI SRA数据库所有数据的检索效劳,也提供这些数据在INSDC相关数据库的下载地点以及最新数据的外地化下载地点。研究职员可以通过NGDC的跨库搜索引擎BIG Search系统,快速查找并选择最优的下载路径获取数据。
GSA正在逐步下载整合NCBI SRA中的历史数据,实现全球生命组学测序数据的外地化治理,为海内科研职员提供数据获取便当的同时,也为全球生命组学数据共享孝顺实力。

BIG-Search检索系统中可实现国际泉源数据检索

GSA页面整合国际泉源数据下载地点
附件下载:






