大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全家桶1年46,售后保障稳定
下载软件(其实就是一堆脚本)
git clone https://github.com/jhcepas/eggnog-mapper.git
下载数据库
alias python=/usr/bin/python2.7
python download_eggnog_data.py
拆分蛋白文件xx.faa
awk '!/^>/ { printf "%s", $0; n = "\n" }
/^>/ { print n $0; n = "" }
END { printf "%s", n }
' /mnt/10t/mzy/dairycow/04.GeneCatelog/uniqGeneSet.faa >uniqGeneSet.faa #把多行显示的fasta文件转换成单行显示
grep -c ">" uniqGeneSet.faa
grep -c $'\n' uniqGeneSet.faa #数一下换行符是不是刚好是序列数的2倍
split -l 6000000 -a 3 -d uniqGeneSet.faa input_file.chunk_ #-l行数;-a表示数字的位数;-d表示待拆分的文件
生成所有命令,切换python版本蛮头疼的,直接指定python程序
for f in *.chunk_*; do echo /usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py -m diamond --no_annot --no_file_comments --cpu 16 -i $f -o $f >>1.sh; done
cat 1.sh | sed ':label;N;s/\n/ \&\& /;b label'>>2.sh
nohup bash 2.sh &
我发现用下面的命令运行,效果更爽
for f in *.chunk_*; do nohup /usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py -m diamond --no_annot --no_file_comments --cpu 36 -i $f -o $f & done
合并生成的seed文件
cat *.chunk_*.emapper.seed_orthologs > input_file.emapper.seed_orthologs
开始注释(这个脚本是32个python一起运行,老壮观了)
/usr/bin/python2.7 /mnt/10t/eggnog-mapper/emapper.py --annotate_hits_table input_file.emapper.seed_orthologs --no_file_comments -o annotation --cpu 32
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/210098.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...