Linux 开始转录组分析之前的文件夹准备工作

这里是写的我个人的理解,是逼着我自己输出的,我尽量以我的逻辑讲出来,所以不确保大家能看的懂。

首先是非常良好的工作习惯,就是建立层级分明的文件夹,以帮助整理我们每次的上游分析的文件。

对于每个具体的项目,我们要建一个文件夹,文件夹的命名方式是:物种-样本数-项目名称-项目处理。我们上游分析的过程是对 rawdata 进行清洗过滤,然后是比对到基因组,最后是定量。在上课时,我们的文件名是:Human-16-Asthma-Trans。所以我们先在家目录里建两个文件夹,一个是 database,这个是放基因组文件的,比如人的,小鼠的基因组,后续用于比对。另一个是我们的具体的项目名称,也就是这里的 Human-16-Asthma-Trans,当然将来还有其它的项目,就接着这个建立平行的文件夹。

在 Human-16-Asthma-Trans 文件夹中,我们将根据分析的过程进一步的建立文件夹:

cd Human-16-Asthma-Trans # 进入具体的分析目录

mkdir -p data/rawdata data/cleandata/trim_galore data/cleandata/fastp # 这步是建立数据处理的文件夹,我们后面会用 trim-galore, fastp 对数据进行清洗,所以 cleandata 下游这两个文件夹,事实上,这是老师让我们学习这两个文件夹件,将来可以只用顺手的那个。当然 cleandata 是与 rawdata 平行的,作为整个 Human-16-Asthma-Trans 下面的 data 的子文件夹。

mkdir -p Mapping/Hisat2 Mapping/Subjunc # 在 Human-16-Asthma-Trans 下面继续建立比对文件夹,因为我们清洗数据后,就开始做比对基因组的事情,这是用 Hisat2 和 Subjunc 两个软件。

mkdir -p Expression/featureCounts Expression/Salmon #将 reads 过滤,比对了基因之后,就对这些基因进行定量了,我们用的是 featureCounts 和 Salmon 两个软件。

这就是文件夹准备工作

版权声明:
作者:siwei
链接:https://www.techfm.club/p/69394.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>