关于NCBI-SRA数据不再提供质量值的解决方案

近期在NCBI SRA中下载的FastQ数据不再提供质量值信息(图1和图2),据说是为了后期便于敛财收费提供质量值,鄙人对这种万恶的资本主义行径大为不齿,NCBI这是自绝于世界人民之举,FastQ中没有质量值将严重影响reads组装等分析,从而严重影响科研进程,拖慢了医疗、工业等领域的发展。

图1 NCBI下载的FastQ数据质量信息全部变成”?"

图2 NCBI下载的FastQ数据质量信息全部变成30

好在,经研究测试,可使用替代方案从EBI数据库下载有质量值的FastQ数据。替代方案的具体操作步骤如下:

  1. 进入EBI数据库,搜索目标SRA数据。
  2. 获取数据下载链接,例如,vol1/fastq/SRR203/072/SRR20318972/SRR20318972_1.fastq.gz和vol1/fastq/SRR203/072/SRR20318972/SRR20318972_2.fastq.gz
  3. 采用ascp下载:
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T [email protected]:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_1.fastq.gz .
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T [email protected]:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_2.fastq.gz .

下载完毕后即可获得有质量值的SRA FastQ文件。

其中ascp相关软件的配置方法详见应用Aspera高速下载NCBI和EBI数据 - 简书 (jianshu.com)

布莱特杨
2023年1月16日编辑
2023年5月31日 15:02发布

版权声明:
作者:Alex
链接:https://www.techfm.club/p/51200.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>