中国核酸数据库GSA数据提交指南
时间:2022-07-28
本文章向大家介绍中国核酸数据库GSA数据提交指南,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
注册并登录生物数据递交系统(BIG Sub, https://bigd.big.ac.cn/gsub/)
GSA的数据模型
为确保与国际同类数据库系统的兼容性,GSA遵循INSDC联盟的数据标准,GSA元数据类别主要包括项目信息(BioProject,归档于生物项目数据库)、样本信息(BioSample,归档于生物样本数据库)、实验信息(Experiment)、以及测序反应(Run)信息。项目信息是用来描述所开展研究的目的、涉及物种、数据类型、研究思路等信息;样本信息是指本研究涉及的生物样本描述,如样本类型、样本属性等;实验信息包括实验目的、文库构建方式、测序类型等信息;测序反应信息包括测序文件和对应的校验信息。各类数据之间采用线性、一对多的模式进行关联,从而形成“金字塔”式的信息组织与管理模式(图1)。
主要分为三个部分
1.创建项目(BioProject); 2.创建样本(BioSample); 3.创建GSA数据集;
1. 创建项目(BioProject)
如果您之前没有创建项目(BioProject)请进入 BioProject 数据库完成创建: BioProject的构建分为五个步骤。
- 第一个是提交者信息,这里一般不需要修改,直接点击保存即可。
- 第二个是基本信息:我们需要指定发布的日期,这里选择日期,不同于NCBI的是在我们公开的日期之前,数据可以随时修改时间。
- 第三个是项目类型:按自己数据类型填写就好。
- 第四个出版信息:空着就可以
- 第五个就是概况信息:预览,检查前面几个填写的内容,如果发现前面有内容不对,直接点击这五个模块中的任何一个都可以转到该模块进行更正。
2. 创建样本(BioSample)
详细说明文件:https://bigd.big.ac.cn/gsub/document/BioSample-BioSample_Submission_Guide_2.2.cn.pdf
如果您之前没有创建样本(BioSample)请进入 BioSample 数据库完成创建:
- 第一步都一样,是确认提交者信息,一般不做修改:
- 第二步 选择时间和项目同一个试时间即可,输入项目号,注意项目号就是上面我们填写完成后生成的。
- 第三步:填写样本类型
- 第四步: 填写样本文件
- 第五步: 查看我们填写的信息。
3. 构建GSA数据集
完成 GSA数据集中Experiment和Run的元数据信息录入——实现与BioProject、BioSample和数据文件的相互关联。通过FTP完成数据文件上传。
- 第一步: 点击GSA按照图中顺序进行点击,第一个提交者信息和前面两个都是一样的,所以只需要保存就好。
- 第二步:填写一个xlsx,包含两个sheets,包括一些数据的基本信息,填好上传即可,注意数据只能提交压缩格式。基本信息的填写说明:https://bigd.big.ac.cn/gsub/document/batch/gsa/GSA_batch_submit_template_help_document.cn.pdf
- 第三步:上传数据,这里我选择用Aspera命令行上传
ascp -P 33001 -i /your/path/key/aspsub_rsa -QT -l100m -k1 -d /your/data/path/fastqs aspsub@submit.big.ac.cn:uploads/z0000@gmail.com_f9ff019d
- 第四步:查看是否正确
- 第五步:上传结果修改和追踪 可以参考:https://bigd.big.ac.cn/gsa/document/GSA-GSA_Submission_Guide_2.2.cn.pdf 通常状况下,数据信息与文件审核归档约需要 1-2 天,归档成功后会收到通知邮件,并可在 GSA 列表中查找的分配的 GSA 编号。
参考: http://blog.sciencenet.cn/blog-3334560-1218399.html https://bigd.big.ac.cn/gsa/documents
- 如何使用SAML配置CDSW的身份验证
- ASP.NET MVC编程——控制器
- ASP.NET MVC编程——视图
- 设计原则
- Entity Framework——配置文件设置
- 如何安装SAS并配置连接Hive/Impala
- Entity Framework——记录执行的命令信息
- 【BlackHat 2017 议题剖析】连接的力量:GitHub 企业版漏洞攻击链构造之旅
- CVE-2015-1641 Word 利用样本分析
- Cloudera Navigator介绍与安装
- [LeetCode]String主题系列{第5,6题}
- CDH内存调拨过度警告分析
- Ztorg:从 root 到 SMS
- [LeetCode]Math主题系列{第7,9,13,273题}
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 什么是时间分片(Time Slicing)?
- 48岁的C语言,你知道它背后的历史吗?
- 【技术创作101训练营】我是如何使用freemarker生成Word文件的?
- 4种主流超参数调优技术
- PyTorch 最佳实践:模型保存和加载
- 突击并发编程JUC系列-启航篇
- 拜托!别再问我多线程的这些问题了
- Tomcat 架构原理解析到架构设计借鉴
- C++核心准则T.65:使用标签分发提供函数的不同实现
- Java开发中Websocket的技术选型参考
- Java 15正式发布,腾讯做出了突出贡献
- Mybatis是如何向Spring注册Mapper的
- 打卡群刷题总结0917——买卖股票的最佳时机
- Fiddler对安卓App抓包(逍遥模拟器APP)
- 为何Android 7.0 以上Charles和Fiddler无法抓取HTTPS包?