人鼠基因名同源转换

看了很多教程,看完了还是干着急不能用。自己根据之前的经验结合一个小的文件,

参考官网
mouse_human_genes = read.csv("http://www.informatics.jax.org/downloads/reports/HOM_MouseHumanSequence.rpt",sep="/t")
这个链接应该是我在使用biomat的时候报错,获取的,然后就直接,下载了这个文件,保存下来自己用。
下载这个文件后,
下载到其人鼠同源基因文件。内容如下:

image.png

所做处理:
提取人鼠的同源基因名,根据第一列进行匹配,随后inner_join,得到一个人鼠均有的同源基因文件,如下:

image.png

放在了代码里了无套路自取,请给本文点个赞
内有鼠对人一对多,和人对鼠一对多的情况出现。请注意筛选。
使用方法如下:

输入数据是你的gene  向量
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
human→mouse
hmtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
tmpgene = 你的基因向量
tmpgene = hmtran(tmpgene)

mouse→human
mhtran <- function(tmpdat){
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$SYMBOL[match(tmpdat$gene,Reference$Symbol)]
  tmpdat <- na.omit(tmpdat)
  return(tmpdat)
}
——————————————————————————————————————
2.0版本
Reference <- read.csv('https://picgo-yxy.oss-cn-guangzhou.aliyuncs.com/img/mouse_human_gene_match.csv')
hmtran <- function(tmpdat){
  tmpdat1 = tmpdat
  tmpdat = data.frame(gene = tmpdat)
  tmpdat$new <- Reference$Symbol[match(tmpdat$gene,Reference$SYMBOL)]
  tmpdat <- na.omit(tmpdat)
  n = length(setdiff(tmpdat1,tmpdat$gene))
  a = signif(n/length(tmpdat1),3)
  tmp = paste(c(setdiff(tmpdat1,tmpdat$gene)),collapse = ' ')
  print(paste0('There are ',a,'% genes fail to trans. They are |||',tmp))
  return(tmpdat)
}
会显示有多少基因没被转换到,心里有个数吧算是。

阿里云好像是根据流量收费的,我不想交钱,苦逼硕士没有钱,所以大家可以从下面下载,其实从上面的代码直接读进R里面也可,但是还是计流量,诶,我这估计也不会有很多人看,应该不用很贵。
文件这里也有一份,以前写的一份教程。
https://www.yuque.com/wuwuyuyu/kb/opzg6n?singleDoc# 《人鼠基因名转化——同源转化》
之前写的很多都在里面,但是垃圾yvque,现在不让免费公开了,烦死了。

版权声明:
作者:siwei
链接:https://www.techfm.club/p/43419.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>