SCENIC feather文件下载记录
最近在学习SCENIC来分析单细胞转录因子活性。在下载这步就卡住了。教程里需要下载好所需的feather文件
根据教程在RStudio中运行,然后再运行如下代码进行下载:
getOption('timeout')
options(timeout=10000)
for(featherURL in dbFiles)
{
download.file(featherURL, destfile=basename(featherURL)) # saved in current dir
(1041.7 MB)
}
在下载文件的时候遇到这个报错: Timeout of 60 seconds was reached 这时就要把timeout的时间延长,给足充足的时间让其下载文件。
下载好后,接着运行如下代码:
library(SCENIC)
保证cisTarget_databases 文件夹下面有下载好2个1G的文件
scenicOptions <- initializeScenic(org="hgnc",
dbDir="cisTarget_databases", nCores=1)
此时,就频繁报错了!
提示位置找不到文件,检查了文件位置,将文件移到相应位置后继续运行还是报错了。
:This Feather file is old and will not be readable beyond the 0.3.0 release
意思是feather文件太老了,不能用了。而且刚报error RStudio就崩溃了。
所以我想的办法是去SCENIC官网上找到新版的hg19的两个文件:
hg19-500bp-upstream-7species.mc9nr.genes_vs_motifs.rankings.feather;
hg19-tss-centered-10kb-7species.mc9nr.genes_vs_motifs.rankings.feather,运行initializeScenic还是报错,提示说找不到mc9nr.feather文件。
我有点爆炸,下载了最新的文件却还是读了不了。
用data <- read_feather("hg19-500bp-upstream-7species.mc9nr.genes_vs_motifs.rankings.feather")读入的时候提示Error: Invalid: Not a feather file。但我查看了文件属性,是feather格式文件,不知道问题出在哪了。
继续搜报错,找到了一位前辈分享的帖子,提供了个新方向,可能原因是下载的文件不完整,于是便去查如何在window检查feather文件的完整性,这里发现了个有用的工具——7-Zip,可以很方便的检查文件完整性。
这不检查不知道,一检查吓一跳,果真是文件不完整出的问题,7-Zip检查的结果和官网上提供的txt结果不一致。
只能重新下载文件,第二次下载的再检查就完全一致了。
再次运行 initializeScenic()成功了!!!
此刻真的要尖叫了,昨晚卡到现在的bug,终于过了。但有点想不明白,为啥同一个下载链接,怎么下载下来的大小还不一样,第一次下载的还比第二次下载的稍微大一些,但检查完整性就不一样。
教训!!!对于大文件下载不要偷懒不去检查文件的完整性!!!不然后面频繁报错真搞心态
链接:cisTarget databases - Feather v1 databases (aertslab.org)
SCENIC: Introduction and setup (htmlpreview.github.io)
听说你也在运行scenic这句命令scenicoptions <-initializescenic(org="mg, dbdir="cistarget-databases)的时候R会崩溃? - 简书 (jianshu.com)
单细胞转录因子分析之SCENIC流程 - 知乎 (zhihu.com)
共有 0 条评论