BG视讯

北京基因组所(国家生物信息中心)组学原始数据归档库GSA实现与NCBI SRA数据库的数据整合

  克日 ,在国际核酸序列数据库相助同盟(INSDC)的支持和美国国家生物信息手艺中心(NCBI)的手艺协助下 ,BG视讯(国家生物信息中心)国家基因组科学数据中心(CNCB-NGDC)完成NCBI生物项目治理数据库(BioProject)、生物样本治理数据库(BioSample)所有数据及序列片断归档库(Sequence Read Archive, SRA)所有元数据与自主开发数据库的整合 ,实现了上述数据在NGDC网站的一站式检索与会见 ,极大提升了海内科研职员盘问和获取数据的效率 。

  CNCB-NGDC 2015年开发的组学原始数据归档库(Genome Sequence Archive, GSA)是中国首个测序数据归档系统 ,已完成NCBI SRA所有元数据及2022年4月20日起SRA日更新全量数据(元数据和原始序列数据)的整合 。阻止5月28日 ,GSA收录460万测序数据集 ,涵盖近2000万实验数据和2074多万测序反应 ,测序序列数据量凌驾13PB 。特殊指出的是 ,GSA现在提供NCBI SRA数据库所有数据的检索效劳 ,也提供这些数据在INSDC相关数据库的下载地点以及最新数据的外地化下载地点 。研究职员可以通过NGDC的跨库搜索引擎BIG Search系统 ,快速查找并选择最优的下载路径获取数据 。
  GSA正在逐步下载整合NCBI SRA中的历史数据 ,实现全球生命组学测序数据的外地化治理 ,为海内科研职员提供数据获取便当的同时 ,也为全球生命组学数据共享孝顺实力 。
BG视讯·大游(集团)官方网站
BIG-Search检索系统中可实现国际泉源数据检索
 
BG视讯·大游(集团)官方网站
GSA页面整合国际泉源数据下载地点  
附件下载:
【网站地图】【sitemap】