vcf格式

vcf格式“`VariantCallFormat(VCF)是一个用于存储基因序列突变信息的文本格式。表示单碱基突变,插入/缺失,拷贝数变异和结构变异等。BCF格式文件是VCF格式的二进制文件。CH

大家好,又见面了,我是你们的朋友全栈君。

    Variant Call Format(VCF)是一个用于存储基因序列突变信息的文本格式。表示单碱基突变, 插入/缺失, 拷贝数变异和结构变异等。BCF格式文件是VCF格式的二进制文件。

  CHROM [chromosome]: 染色体名称。

  POS [position]: 参考基因组突变碱基位置,如果是INDEL(插入缺失),位置是INDEL的第一个碱基位置。

  ID [identifier]: 突变的名称。若没有,则用‘.’表示其为一个新变种。

  REF [reference base(s)]: 参考染色体的碱基,必须是ATCGN中的一个,N表示不确定碱基。

  ALT [alternate base(s)]: 与参考序列比较,发生突变的碱基;多个的话以“,”连接, 可选符号为ATCGN*,大小写敏感。

  QUAL [quality]: Phred标准下的质量值,表示在该位点存在突变的可能性;该值越高,则突变的可能性越大;计算方法:Phred值 = -10 * log (1-p) p为突变存在的概率。

  FILTER [filter status]: GATK使用其它的方法进行过滤后得到的过滤结果,如果通过则该值为“PASS”;若此突变不可靠,则该项不为”PASS”或”.”。

  INFO [additional information]: 表示变异的详细信息

  DP [read depth]: 样本在这个位置的一些reads被过滤掉后的覆盖度

  DP4 : 高质量测序碱基,位于REF或者ALT前后

  MQ [mapping quality]: 表示覆盖序列质量的均方值RMS

  FQ : Phred值关于所有样本相似的可能性

  AF1 [allele frequency]: 表示Allele(等位基因)的频率,AF1为第一个ALT等位基因发生频率的可能性评估

  AC1 [allele count]: 表示Allele(等位基因)的数目,AC1为对第一个ALT等位基因计数的最大可能性评估

  AN [allele number]: 表示Allele(等位基因)的总数目

  IS : 插入缺失或部分插入缺失的reads允许的最大数量

  AC [allele count]: 表示该Allele(等位基因)的数目

  G3 : ML 评估基因型出现的频率

  HWE : chi^2基于HWE的测试p值和G3

  CLR : 在受到或者不受限制的情况下基因型出现可能性的对数值

  UGT : 最可能不受限制的三种基因型结构

  CGT : 最可能受限制三种基因型结构

  PV4 : 四种P值的误差,分别是(strand、baseQ、mapQ、tail distance bias)

  INDEL : 表示该位置的变异是插入缺失

  PC2 : 非参考等位基因的Phred(变异的可能性)值在两个分组中大小不同

  PCHI2 : 后加权chi^2,根据p值来测试两组样本之间的联系

  QCHI2 : Phred标准下的PCHI2.

  PR : 置换产生的一个较小的PCHI2

  QBD [quality by depth]: 表示测序深度对质量的影响

  RPB [read position bias]: 表示序列的误差位置

  MDV : 样本中高质量非参考序列的最大数目

  VDB [variant distance bias]: 表示RNA序列中过滤人工拼接序列的变异误差范围

  GT [genotype]: 表示样品的基因型。两个数字中间用‘/’分 开,这两个数字表示双倍体的sample的基因型。

  0 表示样品中有ref的allele

  1 表示样品中variant的allele

  2表示有第二个variant的allele

  0/0 表示sample中该位点为纯合的,和ref一致

  0/1 表示sample中该位点为杂合的,有ref和variant两个基因型

  1/1 表示sample中该位点为纯合的,和variant一致

  GQ [genotype quality]: 表示基因型的质量值。Phred格式的质量值,表示在该位点该基因型存在的可能性;该值越高,则Genotype的可能性越 大;计算方法:Phred值 = -10 * log (1-p) p为基因型存在的概率。

  GL : 三种基因型(RR RA AA)出现的可能性,R表示参考碱基,A表示变异碱基

  DV : 高质量的非参考碱基

  SP : Phred的p值误差线

  PL [provieds the likelihoods of the given genotypes]: 指定的三种基因型的质量值。三种指定的基因型为(0/0,0/1,1/1),这三种基因型的概率总和为1。该值越大,表明为该种基因型的可能性越小。 Phred值 = -10 * log (p) p为基因型存在的概率。

  FORMAT : 用于描述样本的(可选)可扩展的字段列表

  SAMPLEs : 对于文件中描述的每一个(可选)样本,给出了在格式中列出的字段的值
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/154962.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • loadrunner性能测试步骤_loadrunner可以做接口测试吗

    loadrunner性能测试步骤_loadrunner可以做接口测试吗LoadRunner性能测试教程1.工具介绍及下载2.操作步骤2.1.VuGen脚本编写及运行2.2.Controller场景运行2.3.Alalysis分析1.工具介绍及下载LoadRunner,是一种预测系统行为和性能的负载测试工具。通过模拟上千万用户实施并发负载及实时性能监测的方式来确认和查找问题,LoadRunner能够对整个企业架构进行测试。企业使用LoadRunner能最大限度地缩短测试时间,优化性能和加速应用系统的发布周期。LoadRunner可适用于各种体系架构的自动负载测试,能预测系统

    2022年10月10日
  • PHP filemtime() 函数

    PHP filemtime() 函数

  • 网线RJ45接口排线示意图(做网线备用)「建议收藏」

    网线RJ45接口排线示意图(做网线备用)「建议收藏」网线RJ45接口排线示意图(做网线备用)RJ45有两种绕线方式,T-568A和T-568B。注意:绝大多数设备用的都是T-568B!!!请参照T-568B的线序!!!我的热门文章推荐多路视频直播用在线云导播切换的效果测试 如何把视频转换生成二维码,扫码直接播放? 有哪些网站上传视频是不会插入广告的? 怎么把视频生成二维码?微信扫二维码就可以观看?不要广告的 常用照片尺寸对照表,照片大小看这个表就对了 视频直播推流攻略(整理的各大平台推流界面) html5视频倍.

  • 算法高级(21)-如何通过IP地址进行定位?[通俗易懂]

    最近项目有一个用户地域分析的需求,现在知道ip字段,需要通过用户的ip查找归属地,我们这里将ip直接转换成对应城市的字符串。一、通过IP库二分查找ip库是从淘宝买的,csdn下载地址:【ip字段国内外均有】ip.txt是ip地址和归属地的规则数据,里面的数据是根据ip地址的十进制从高到低排序。 第一个字段是网段的起始IP地址,第二个字段是网段的结束IP地址, 第三个字段是网段的…

  • matlab矩阵怎么进行相加,matlab矩阵如何运算相加

    matlab矩阵怎么进行相加,matlab矩阵如何运算相加matlab矩阵如何运算相加发布时间:2020-12-1114:26:52来源:亿速云阅读:61作者:小新这篇文章主要介绍了matlab矩阵如何运算相加,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。matlab矩阵运算相加的方法:首先需要在matlab命令窗口中创建一个矩阵或数组;然后两矩阵相加需维数一致,在MATLAB中输入代码【A…

  • 获取窗口句柄 c语言,VC++编程获取窗口句柄的方法小结分享「建议收藏」

    获取窗口句柄 c语言,VC++编程获取窗口句柄的方法小结分享「建议收藏」—-想了解VC++编程获取窗口句柄的方法小结分享的全部内容且更多的C语言教程关注VC++编程获取窗口句柄的方法小结分享实例讲述了VC++编程获取窗口句柄的方法。分享给大家供大家参考,具体如下:在VC++编程中常需获取控件或窗体句柄,下面总结了几种方法,还希望大家能多多补充。1、自身窗口句柄可用AfxGetMainWnd获取。2、系统中其他APP的窗口句柄可用FindWindow获取(用SPY帮一下…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号