pageruler蛋白marker_蛋白marker上样量

pageruler蛋白marker_蛋白marker上样量下载软件(其实就是一堆脚本)gitclonehttps://github.com/jhcepas/eggnog-mapper.git下载数据库aliaspython=/usr/bin/python2.7pythondownload_eggnog_data.py拆分蛋白文件xx.faaawk’!/^>/{printf”%s”,$0;n=”\…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

下载软件(其实就是一堆脚本)

git clone https://github.com/jhcepas/eggnog-mapper.git

Jetbrains全家桶1年46,售后保障稳定

下载数据库

alias python=/usr/bin/python2.7
python download_eggnog_data.py 

拆分蛋白文件xx.faa

awk '!/^>/ { printf "%s", $0; n = "\n" } 
/^>/ { print n $0; n = "" }
END { printf "%s", n }
'  /mnt/10t/mzy/dairycow/04.GeneCatelog/uniqGeneSet.faa >uniqGeneSet.faa #把多行显示的fasta文件转换成单行显示 
grep -c ">" uniqGeneSet.faa
grep -c $'\n' uniqGeneSet.faa  #数一下换行符是不是刚好是序列数的2倍
split -l 6000000 -a 3 -d uniqGeneSet.faa input_file.chunk_ #-l行数;-a表示数字的位数;-d表示待拆分的文件

生成所有命令,切换python版本蛮头疼的,直接指定python程序

for f in *.chunk_*; do echo /usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py -m diamond --no_annot --no_file_comments --cpu 16 -i $f -o $f >>1.sh; done
cat 1.sh | sed ':label;N;s/\n/ \&\& /;b label'>>2.sh
nohup bash 2.sh &

我发现用下面的命令运行,效果更爽
for f in *.chunk_*; do nohup /usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py -m diamond --no_annot --no_file_comments --cpu 36 -i $f -o $f & done

合并生成的seed文件

cat *.chunk_*.emapper.seed_orthologs > input_file.emapper.seed_orthologs

开始注释(这个脚本是32个python一起运行,老壮观了)

/usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py --annotate_hits_table input_file.emapper.seed_orthologs --no_file_comments -o annotation --cpu 32

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/210098.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号