blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]

blast+本地化中blastp操作(基于PDB库)—linux[通俗易懂]blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

blast+本地化的构建对于流程化处理大量数据序列很方便,blast+是将blast模块化,分为了蛋白质序列比对蛋白数据库(blastp)、核酸序列比对核酸数据库(blastn)、核酸序列比对蛋白质数据库(blastx)、蛋白质比对翻译后的核酸数据库(tblastn)、

翻译后的核酸序列比对翻译后的核酸数据库(tblastx)

BLAST+ 链接地址:   ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST

得到最新版本的blast+压缩包:ncbi-blast-2.9.0+-x64-win64.tar.gz

对安装包进行解压:

[wangh@master Softbacks]$ tar -zxvf ncbi-blast-2.9.0+-x64-linux.tar.gz
[wangh@master Softbacks]$ cd ncbi-blast-2.9.0+
[wangh@master ncbi-blast-2.9.0+]$ vim ~/.bashrc # 对blast+进行环境配置,进入变量配置环境中后,按i或者o切换到插入(编辑模式下)输入下列路径
# ncbi-blast
export PATH=/path/ncbi-blast-2.9.0+/bin/:$PATH
#######按Esc键退出编辑环境,再输入 :wq  命令进行写入保存(w)退出(q) 按回车键(Enter)退出
[wangh@master ncbi-blast-2.9.0+]$ source ~/.bashrc #刷新你的环境配置文件,使得系统识别你刚加入的环境变量(也可以关闭当前终端再次打开,系统自动刷新环境配置文件)

 blastp 的用法:

数据库从PDB中下载: ftp://ftp.wwpdb.org/pub/pdb/derived_data/pdb_seqres.txt

用cd-hit处理去冗余(解压后加变量后就能用)

$: cd-hit -i /path/pdb_seqres_simp.fasta -o PDB_simp.fasta -c 0.9

格式化数据库:

$: makeblastdb –in PDB_simp.fasta –dbtype prot –out PDB

-in:待格式化处理的fasta文件(一般是从PDB/NCBI里下载所有的相关或者整个库中的序列);

-dbtype: 数据库类型,prot或者nucl;

-out: 输出的数据库名;
蛋白质比对蛋白数据库(blastp):
blastp –query name.fasta –out name.blast –db PDB –outfmt 6 –evalue 1e-5 –num_threads 11 –max_target_seqs 6

参数说明:

-query: 输入文件路径及文件名(.fasta格式);
-out: 输出文件路径及文件名(.blast);
-db: 格式化了的数据库路径及数据库名(数据库可以从PDB/NCBI里下载所有的相关/整个库中的序列);
-outfmt:输出的文件格式,6是tabular格式对应BLAST的m8格式;
-evalue: 设置输出结果的e-value值;
-max_target_seqs:找到最大的目标的数目,也可以用-num_descriptions,tabular格式输出结果的条数;
-num_threads :线程数,并行运行时,缩短计算时间。

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/168185.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • C语言输出有颜色的字体

    C语言输出有颜色的字体先看下面的一段代码:#include<stdio.h>intmain(intargc,char**argv){printf(“\033[44;37;5mhelloworld\033[0m\n”);return0;}编译后运行上述代码,结果如下:可见,此时输出的字体和背景已经有了颜色。由上可知,在输出时候加上“\033[…

  • leetcode-41缺失的第一个正数

    leetcode-41缺失的第一个正数原题链接给你一个未排序的整数数组 nums ,请你找出其中没有出现的最小的正整数。进阶:你可以实现时间复杂度为 O(n) 并且只使用常数级别额外空间的解决方案吗?示例 1:输入:nums = [1,2,0]输出:3示例 2:输入:nums = [3,4,-1,1]输出:2示例 3:输入:nums = [7,8,9,11,12]输出:1 提示:0 <= nums.length <= 300-231 <= nums[i] <= 231 – 1题解

  • MySQL主从复制配置[通俗易懂]

    MySQL主从复制配置[通俗易懂]MySQL主从复制及读写分离一、MySQL复制的应用常见场景 读写分离,提高查询访问性能,有效减少主数据库访问压力。 实时灾备,主数据库出现故障时,可快速切换到从数据库。 数据汇总,可将多个主数据库同步汇总到一个数据库中,方便数据统计分析。 二、MySQL主从复制原理介绍1、MySQL异步和半同步复制传统的MySQL复制提供了一种简单的主-从复制方法。有一个主,以及一个或多个从。主节点执行和提交事务,然后将它们(异步地)发送到从节点,以重新…

  • eigen库的使用_vcg库

    eigen库的使用_vcg库Eigen矩阵定义#includeMatrixdouble,3,3>A;//Fixedrowsandcols.SameasMatrix3d.Matrixdouble,3,Dynamic>B;//Fixedrows,dynamiccols.Matrixdouble,Dynamic,Dynam

  • css transition动画_css3过渡属性有几种

    css transition动画_css3过渡属性有几种css动画效果之transition(动画效果属性)

  • QMap详解「建议收藏」

    QMap详解「建议收藏」QMap详解QMap是Qt的一个模板类,它是基于红黑树算法的一套字典。QMap<Key,T>是Qt容器类型的一种,它通过(Key,value)存储一对值,并通过Key可以查找与之关联的value的值。QMap和QHash是很相似的,不同的地方是:QHash的查找速度比QMap要快很多。在对QHash进行迭代时,这些项是任意排序的。在QMap中,项总是按键排序。QHash的关键类型必须提供运算符==()和全局QHash(key)函数。QMap的关键类型必须提供操作符<(

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号