如何利用在线工具分析转录调控——TRRUST数据库的使用

引言

TRRUST数据库是一个人工管理的人类和小鼠转录调控网络数据库,可以分析转录因子(IF)与靶基因之间的调控关系。当前版本的TRRUST分别包含800个人类的TF和828个小鼠的TF,以及与其他非转录因子的调控关系。数据源自11237篇发表的文章,这些文章描述了转录调控的小规模实验研究。

下面我们来介绍一下如何使用这个数据库完成转录因子的预测。首先进入数据库网站https://www.grnpedia.org/trrust/,我们可以看到网站首页有三个可选选项,包括“About TRRUST”,“Search”,“Download”,一般我们的分析是在Search选项进行的。

这里我们点击Search,进入如下页面:

可以看到这里有两部分内容,我们先来讲解第一部分:

Search a gene in TRRUST database

在这可以输入一个基因预测它的IF和靶基因,物种根据自己的研究需求选择即可。当然我们也可以下拉Examples选项查看数据库官方给出的示例基因。

大家要知道,如果输入的基因是转录因子或非转录因子,结果会有所不同。比如,我们应用官方给出的转录因子BRCA1为例,直接点击选项,然后点击提交。

接下来我们看下得到的结果,首先网站会告诉我们,BRCA1 is a Transcription Factor,也就是首先明确这个基因是一个转录因子。然后我们看下面的分析结果。

1.Targets and Regulators:

第一个表格这里展示的是该目标基因作为一个转录因子有哪些靶基因,表格中的内容我们已经进行了标注,后面的图就是转录因子和这些靶基因之间的互作网络图。

第二个表格这里展示的是该基因是哪些转录因子的靶基因,有哪些上游的转录因子,同样表格第一列为预测的BRCA1的转录因子,第二列是我们的输入目标基因BRCA1,对于后面的解读和上一个表格是一样的。

2.Other TFs that share targets with BRCA1:

也就是还有哪些其他的转录因子与BRCA1共享了靶基因。表格中第一列是检索到的转录因子的名称,第二列是与BRCA1转录相同的靶基因的数量,后面两列分别为p值和FDR。

3.Diseases / Pathways associated with BRCA1:

也就是与该基因有关的疾病或者通路。首先是疾病:

接下来是KEGG通路:

最后是GO功能:

这一部分内容有助于我们更加全面的认识目标基因的转录因子与靶基因的情况,并且了解其在疾病或者功能通路方面的作用。

接下来要讲解的是,如果前面输入的基因是一个非转录因子又是什么样的结果。这里我们以示例基因CDKN1A为例,就会出现下面的界面,并提示我们:CDKN1A is not a Transcription Factor。也就是这个输入基因不是转录因子,结果只有下面一个表格,我们来看下表格中的内容。和前面一样,第一列是预测到的这个输入基因的转录因子,第二列是靶基因也就是输入的基因,第三列和第四列分别是调控方式和参考文献,后面的图就是互作网络图。

前面我们讲的是Search选项的第一部分,再来看下第二部分:

Find key regulators for query genes。

也就是寻找输入基因中的关键调控因子,这里需要注意下面的小标:最少基因数为5,最大基因数为500,并且每个基因名称必须用逗号、制表符、空格或换行分隔。对于输入基因名的要求是:输入格式为Entrez Gene ID 或 Gene Symbol。这些注意事项需要留意,要不然很可能输入数据不符合要求。这里继续以示例数据为例给大家讲解,用到的一组基因是ESR1敲低后的差异基因,选中之后点击提交即可。(如果输入自己的基因集合一定要注意基因之间的分隔符!可以参照示例数据集。)

点击提交之后看下结果,首先最上面显示的是输入基因集的情况,包括有效查询基因(33个),无效查询基因(0个)、以及查询TRRUST中包含的基因(12个)。

表格当中展示的是关键转录因子的名称、对其描述、重叠的基因数以及P值、FDR。那么重叠的基因数越多,就表明这个基因越重要。

对于TRRUST数据库的使用就介绍完啦,

今天是不是又收获了满满干货呢,

我们下期再见!

—END—

版权声明:
作者:admin
链接:https://www.techfm.club/p/54162.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>