一、基本使用场景

1. 单倍型推断(Phasing)

将未分型的基因型数据(如 VCF/BCF 文件)推断为单倍型。

java -jar beagle.jar \
gt=input.vcf.gz \ # 输入基因型数据(需bgzip压缩)
out=phased_output # 输出文件前缀(自动生成 .vcf.gz 和 .log)

2. 基因型填充(Imputation)

使用参考面板填充目标数据中的缺失基因型。

java -jar beagle.jar \
gt=target.vcf.gz \ # 待填充的目标数据
ref=reference.vcf.gz \ # 参考面板(如千人基因组)
out=imputed_output # 输出文件名前缀

二、核心参数说明

参数 作用 示例值
gt 输入基因型数据(VCF/BCF) gt=data.vcf.gz
ref 参考面板文件(用于填充) ref=1kgp.vcf.gz
out 输出文件前缀 out=result
nthreads 使用的CPU线程数 nthreads=4
window 分析窗口大小(cM) window=40
impute 强制填充缺失基因型 impute=true
Xmx Java堆内存分配 java -Xmx8g -jar beagle.jar ...

三、进阶使用示例

1. 使用参考面板和外部遗传图谱

java -jar beagle.jar \
gt=target.vcf.gz \
ref=reference.vcf.gz \
map=genetic_map.b37.txt \ # 遗传图谱文件(染色体位置→cM)
out=imputed_with_map

2. 多线程加速(推荐用于大型数据)

java -Xmx16g -jar beagle.jar \  # 分配 16GB 内存
gt=large_data.vcf.gz \
nthreads=8 \ # 使用8个CPU线程
out=fast_phasing

四、输入文件准备

  1. VCF文件压缩和索引:

    bgzip input.vcf           # 压缩为 .vcf.gz
    tabix -p vcf input.vcf.gz # 生成索引文件 .tbi
  2. 参考面板下载:

    • 千人基因组计划参考面板(1KGP):

    wget ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/

五、输出文件说明

phased_output.vcf.gz:分型/填充后的结果(bgzip压缩)。

phased_output.log:运行日志(检查错误和耗时)。

phased_output.phased.vcf.gz(旧版本可能生成此文件)。


六、常见问题

1. 内存不足(OutOfMemoryError)

增加Java堆内存(如分配32GB):

java -Xmx32g -jar beagle.jar ...

2. 输入文件格式错误

• 错误信息:Invalid VCF headerCould not read input file

• 解决:

  1. bcftools 验证文件:
    bcftools view input.vcf.gz
  2. 确保文件用 bgzip(而非 gzip)压缩。

3. 参考面板与目标数据不兼容

• 表现:填充后结果异常或报错。

• 解决:确保参考面板和目标数据的基因组版本一致(如 hg19 vs. hg38)。


七、参考资源

• 官方文档:http://faculty.washington.edu/browning/beagle/beagle_5.4_08Jul22.pdf

• 示例数据集:https://github.com/chrchang/beagle-examples

beagle 的使用方法和参数信息的更多相关文章

  1. Mui中mui.openWindow()方法具体参数信息(内容来自Mui问题专区)

    mui.openWindow({ url: 'xxx.html', //String类型,要打开的界面的地址 id: 'id', //String类型,要打开的界面的id styles: { //We ...

  2. APK自我保护方法

    标 题: [原创]APK自我保护方法 作 者: MindMac 时 间: 2013-12-28,21:41:15 链 接: http://bbs.pediy.com/showthread.php?t= ...

  3. 【JVM虚拟机】(8)--深入理解Class中--方法、属性表集合

    #[JVM虚拟机](8)--深入理解Class中--方法.属性表集合 之前有关class文件已经写了两篇博客: 1.[JVM虚拟机](5)---深入理解JVM-Class中常量池 2.[JVM虚拟机] ...

  4. Aop实现拦截方法参数

    对于spring框架来说,最重要的两大特性就是AOP 和IOC. 以前一直都知道有这两个东西,在平时做的项目中也常常会涉及到这两块,像spring的事务管理什么的,在看了些源码后,才知道原来事务管理也 ...

  5. java反射——方法

    大家都知道反射技术在Java里面时非常重要的一个技术点,因为Java好多框架的编写都是基于反射的,别的不多说,spring框架里面的IOC就是基于反射实现.那么什么是反射呢?JAVA反射机制是在运行状 ...

  6. android黑科技系列——获取加固后应用App的所有方法信息

    一.前言 在逆向应用的时候,我们有时候希望能够快速定位到应用的关键方法,在之前我已经详细介绍了一个自己研发的代码动态注入工具icodetools,来进行动态注入日志信息到应用中,不了解的同学可以查看这 ...

  7. mybatis源码探索笔记-3(使用代理mapper执行方法)

    前言 前面两章我们构建了SqlSessionFactory,并通过SqlSessionFactory创建了我们需要的SqlSession,并通过这个SqlSession获取了我们需要的代理mapper ...

  8. Java Record 的一些思考 - 默认方法使用以及基于预编译生成相关字节码的底层实现

    快速上手 Record 类 我们先举一个简单例子,声明一个用户 Record. public record User(long id, String name, int age) {} 这样编写代码之 ...

  9. 【腾讯Bugly干货分享】移动App入侵与逆向破解技术-iOS篇

    本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/577e0acc896e9ebb6865f321 如果您有耐心看完这篇文章,您将懂 ...

  10. 用Android Studio开发最常用到的快捷键

    Android Studio常用快捷键 Android Studio日常开发常用快捷键. 快捷键版本: Mac OS X 10.5+ 搜索查看类 用途 Mac快捷键 搜索所有文件 double Shi ...

随机推荐

  1. Linux驱动---LED

    目录 一.pinctrl子系统 二.GPIO子系统 三.GPIO操作步骤 3.1.获取GPIO描述符 3.2.设置方向 3.3.读写值 四.编写LED驱动 4.1.硬件原理图 4.2.修改设备树 4. ...

  2. 基于iscsi存储池

    命令行 [root@kvm1 ~]# virsh pool-define-as --name stor2 --type iscsi \ > --source-host 192.168.114.1 ...

  3. RabbitMQ(七)——主题模式

    RabbitMQ系列 RabbitMQ(一)--简介 RabbitMQ(二)--模式类型 RabbitMQ(三)--简单模式 RabbitMQ(四)--工作队列模式 RabbitMQ(五)--发布订阅 ...

  4. 最新demo版 | 如何0-1开发支付宝小程序之小程序页面功能介绍(三)

    前两期讲了小程序开发的准备工作以及前期需要如何调试,今天我们就来介绍下开发一个支付宝小程序页面需要了解哪些信息. 一个小程序页面的整体功能的构成离不开页面展示(AXML).页面样式(ACSS)以及页面 ...

  5. 精选4款基于.NET开源、功能强大的通讯调试工具

    前言 今天大姚给大家分享4款基于.NET开源.功能强大的通讯调试工具,旨在帮助.NET开发者们更好的应对通讯调试方面的学习和工作,提升调试效率. LLCOM LLCOM是一个.NET开源的.功能强大的 ...

  6. KUKA库卡机器人保养维修

    KUKA机器人由机械手和控制柜组成,每日机器人保养包括:控制箱.教导盒.手腕之表面擦拭,还有噴槍之清洁. KUKA机器人控制柜保养1)断掉控制柜的所有供电电源.2)检查主机板.存储板.计算板.以及驱动 ...

  7. Thymeleaf Split

    <th:block th:each="image : ${#strings.listSplit(goods.images, ';')}"> <img th:src ...

  8. Sqoop2 - [01] 安装部署

    1.启动Hadoop集群 2.将Sqoop2的安装包上传到合适的目录中解压 tar -zxvf sqoop-1.99.7-bin-hadoop200.tar.gz 3.修改Hadoop的配置文件cor ...

  9. WordPress域名更换小记

    WordPress域名更换记录 1.准备工作 ​ 在开始之前,要有一个全面的备份,包括网站的文件和数据库.这确保了如果出现问题,你可以恢复到更改之前的状态.不然中间卡壳直接连后台都打不开了,只能重装. ...

  10. ubuntu网络连接失败

    首先要保证pc上可以连接上网络,然后进行下面的操作: 1.首先选择VMware的编辑选项 2.选择虚拟网络编辑器 3.还原默认设置,等待几分钟,确定就可以解决了