tophat使用_tophat是什么意思

tophat使用_tophat是什么意思概述:tophat是以bowtie2为核心的一款比对软件。tophat工作分两步:1.将reads用bowtie比对到参考基因组上。2.将unmapped-reads打断成更小的fragment

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

概述:tophat是以bowtie2为核心的一款比对软件。

 

tophat工作分两步:

1.将reads用bowtie比对到参考基因组上。

2.将unmapped-reads打断成更小的fragments,比对到参考基因组上,如果比对成功,建立剪切点。

 

用法:tophat [options]* <index_base> <reads1_1[,…,readsN_1]> [reads1_2,…readsN_2]

 

 <index_base>:参考基因组的index文件的具体目录,例如,index文件存放在当前目录下的index文件夹,文件的名字是hg19.*.*, index数据的文件应该是:./index/hg19,不用写到./index/hg19.*.*。参考基因组应该和index文件放在同一目录中。

reads:PE reads必须放在不同的两个文件中,文件名必须按照*_1, *_2的规范成对出现。如:A.reads1_1.fastq B.reads1_1.fastq A.reads1_2.fastq B.reads1_2fastq

 

常用options:

    -o | –output default: ./tophat_out 输出的文件夹路径。

-r | --mate-inner-dist default: 50 成对的reads之间的平均inner距离。例如:fragments长度300bp,reads长度50bp,则其inner距离为200bp,该值该设为200。

   –mate-std-dev default:20 inner距离的标准偏差。

-a | --min-anchor-length default: 8 read的锚定长度:该参数能设定的最小值为3;锚定在junction两边的reads长度只有都大于此值,才能用于junction的验证。
--library-type Tophat处理的reads具有链特异性。比对结果中将会有个XS标签。一般Illumina数据的library-type为 fr-unstranded。

    -G | –GTF 提供基因模型的注释文件,GTF 2.2 或者 GFF 3 格式的文件。如果设置了该参数,Tophat 则先提取出转录子序列,然后使用Bowtie2将reads比对到提取的转录组中;只有不能比对上 的reads再比对到genome;比对上的reads再打断转变成genomic mappings;再融合新 的mappings和junctions作为最后的输出。 值得注意的是GTF/GFF文件代表chromosome和contig的第一列要和bowtie index中的 参考序列名一致。 




参考文章:
http://blog.sina.com.cn/s/blog_8808cae20101amqp.html



版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/168209.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号