Cellranger 多组学构建自己的参考基因组

多组学分析之间一定要保证不同组学,以及上下游都使用相同的参考基因组,这次笔记每个物种数据涉及两个组学维度的数据,所有一定要保证这两组学数据用的同一个参考基因组,也就是使用的.gtf 和 .fa 文件要一致~

cellranger 用到参考基因组构建,这里使用使用UCSC的基因组演示:
Index of /goldenPath/danRer11/bigZips (ucsc.edu)

cellranger 自定义构建的参考基因组

wget https://hgdownload.soe.ucsc.edu/goldenPath/danRer11/bigZips/danRer11.fa.gz
wget https://hgdownload.soe.ucsc.edu/goldenPath/danRer11/bigZips/genes/danRer11.refGene.gtf.gz
gunzip danRer11.fa.gz
gunzip danRer11.refGene.gtf.gz
# 过滤gtf , 推荐,详细原因可以看官网 , 防止重复对定量的影响
cellranger mkgtf danRer11.refGene.gtf danRer11.refGene.filtered.gtf --attribute=gene_biotype:protein_coding
cellranger mkref --genome=Drerio_genome --fasta=danRer11.fa --genes=danRer11.refGene.filtered.gtf
## 等参考基因组运行完才可以接下来运行

运行cellranger count的参考代码

ID=danio_rerio_snRNA_10x
transcriptome=/path_toRef_genome/10x_cellranger_result_ref_USUC/refGenome_USUC/Drerio/Drerio_genome
fastqs=/path_to_fastq/raw_data/220901B_snzf_snmonhy_snXeno/data/raw
sample=220901B_snzf
cellranger count --id=$ID /
                   --transcriptome=$transcriptome /
                   --fastqs=$fastqs /
                   --sample=$sample /
                   --localcores=80 /
                   --localmem=128 /
                   --include-introns=true /
                   --expect-cells=10000

cellranger-atac 的自定义构建参考基因组

使用cellranger mkref 下面生成的fa和gtf , 否则文件格式报错 , 在此示例中也就是上面运行 cellranger mkref 后生成的 Drerio_genome 基因组文件下的数据

# 在配置文件中输入以下内容后保存(字典格式)
{
    organism: "danio_rerio"
    genome: ["danio_rerio_genome"]
    input_fasta: ["/path_to_genome_fasta/10x_cellranger_result_ref_USUC/refGenome_USUC/Drerio/Drerio_genome/fasta/genome.fa"]
    input_gtf: ["/path_to_genome_genes/10x_cellranger_result_ref_USUC/refGenome_USUC/Drerio/Drerio_genome/genes/genes.gtf.gz"]
}


cellranger-atac mkref  --config=/path/to/config/sheep.config  

会在当前目录下生成danio_rerio_genome目录,里面就是跑 ATAC 用到的参考基因组

看到如上信息,构建成功

运行cellranger-atac count的参考代码

cellranger-atac count /
    --id=snATAC_danio_rerio_count /
    --reference=/path_to_ref_genome/cellranger-10x-ref/ATAC-ref-UCSC/danio_rerio_genome /
    --fastqs=/path_to_fastq/snATAC_rawData/fish-20230909 /
    --sample=Fishhypo /
    --localcores=8 /
    --localmem=64

本笔记参考

10x 官网、 cellranger RNA 定量的参考基因组,ATAC 的定量参考基因组

https://www.10xgenomics.com/support/software/cell-ranger/latest/tutorials/cr-tutorial-mr

https://preview-newmar.herokuapp.com/single-cell-atac/software/pipelines/latest/advanced/references

版权声明:
作者:玉兰
链接:https://www.techfm.club/p/122994.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>