科学家 · 科研服务:0571-87885727
  医   生 · 精准医疗:0571-87885730
  大   众 · 健康检测:0571-87181268
当前所在位置 >如何把原始数据提交到SRA数据库

如何把原始数据提交到SRA数据库

       做高通量测序的老师一般都会遇到这样的问题,要发文章了,需要提前向NCBI提交序列获得登录号,但是如何把高通量测序的原始数据提交到SRA数据库呢?这是一个令人苦恼的问题。别担心,小编经过潜心研究和实际操作后终于掌握方法,在这将方法传授给大家,不要太感谢哦~
 
       NCBI 的 sequence data 包括GenBank、Genomes(WGS)、 TSA、SRA、GEO,用于收录不同的测序类型数据。测序数据需要提交到正确对应的数据库中,原始数据(raw data,通常包括Illumina平台产生的fastq文件、454平台产生的sff文件等),需要提交到SRA数据库。测序分析数据的提交比较繁琐,在这里小编就先分享一下原始数据的提交方法。
 
把原始数据提交到SRA数据库的详细步骤
整个数据结构如下:
BioProject(Study)—BioSample—Experiment—Run
 
1、 登录NCBI账号
      如果没有NCBI账号的同学们不要慌,你可以随时注册一个账号,在登陆界面下方点击Register for an NCBI account后填写相关信息进行注册,然后再登陆。
 
1nbsddd

 
                                                    图1
   NCBI账号的注册
 
2、 建立BioProject和BioSample
BioProject和BioSample的作用是描述老师研究项目的研究背景、材料属性和制备等基本信息的。
 
2.1 BioProject的建立
      登陆NCBI之后点击页面左下角Submit Data,进去之后在Quick Start里面选择BioProject,然后点击GO就进入BioProject了。或者你直接登陆https://submit.ncbi.nlm.nih.gov/subs/bioproject/这个网址也可以。选择New submission,然后按照里面的要求一步一步把你的信息填上去的OK啦,后面BIOSAMPLE和PUBLICATIONS两个界面可以不写相关信息,都直接点Continue,进入OVERVIEW界面。如果有问题可返回修改,没问题的话即可点击submit提交。完成后会生成一个以PRJNA开头命名的BioProject登陆号,这个会发送到你登录NCBI的邮箱里,注意查收就行。
 
2nbsddd
 
                                                    图2    BioProject的建立流程图
 
2.2 BioSample的建立
      这个与上面BioProject的建立大同小异,也是登陆NCBI之后点击页面左下角Submit Data,进去之后在Quick Start里面选择BioSample,然后点击GO就进入BioSample了;或者直接登陆https://submit.ncbi.nlm.nih.gov/subs/biosample/这个网址。然后选择New submission,按照要求填写信息就行了。COMMENTS界面不用填写,最后在OVERVIEW界面点击Submit提交,会生成以SAMN开头的BioSample登陆号,这个同样会发到邮箱里面。
 
3nbsddd
 
                                                    图3    BioSample的建立流程图
 
3、 添加Experiment文件和创建Run
登陆http://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi,选择 NCBI PDA入口,填写个人信息后,点击 create new submission。Experiment信息填写完后点击New Run创建Run,会得到相应的SPX和SRP号,填写原始数据文件格式(一般为fq文件),文件名和MD5值(由测序公司提供)。
 
4nbsddd
 
                                                    图4    Experiment文件和Run的创建
 
4、 数据上传
用NCBI的FTP将原始数据上传到SRA数据库。
Address:ftp-private.ncbi.nlm.nih.gov;
Login:sra;
Password:Qrjo6iJ4
 
FTP上传数据比较慢,推荐可以用WinSCP进行上传,如果出现网络掉线,它会连接好后继续
上传,不必担心从头开始。当上传的列表里全部显示done时即上传成功。

(工作日:8:30-17:30)