beagle 的使用方法和参数信息
一、基本使用场景
1. 单倍型推断(Phasing)
将未分型的基因型数据(如 VCF/BCF 文件)推断为单倍型。
java -jar beagle.jar \
gt=input.vcf.gz \ # 输入基因型数据(需bgzip压缩)
out=phased_output # 输出文件前缀(自动生成 .vcf.gz 和 .log)
2. 基因型填充(Imputation)
使用参考面板填充目标数据中的缺失基因型。
java -jar beagle.jar \
gt=target.vcf.gz \ # 待填充的目标数据
ref=reference.vcf.gz \ # 参考面板(如千人基因组)
out=imputed_output # 输出文件名前缀
二、核心参数说明
参数 | 作用 | 示例值 |
---|---|---|
gt |
输入基因型数据(VCF/BCF) | gt=data.vcf.gz |
ref |
参考面板文件(用于填充) | ref=1kgp.vcf.gz |
out |
输出文件前缀 | out=result |
nthreads |
使用的CPU线程数 | nthreads=4 |
window |
分析窗口大小(cM) | window=40 |
impute |
强制填充缺失基因型 | impute=true |
Xmx |
Java堆内存分配 | java -Xmx8g -jar beagle.jar ... |
三、进阶使用示例
1. 使用参考面板和外部遗传图谱
java -jar beagle.jar \
gt=target.vcf.gz \
ref=reference.vcf.gz \
map=genetic_map.b37.txt \ # 遗传图谱文件(染色体位置→cM)
out=imputed_with_map
2. 多线程加速(推荐用于大型数据)
java -Xmx16g -jar beagle.jar \ # 分配 16GB 内存
gt=large_data.vcf.gz \
nthreads=8 \ # 使用8个CPU线程
out=fast_phasing
四、输入文件准备
VCF文件压缩和索引:
bgzip input.vcf # 压缩为 .vcf.gz
tabix -p vcf input.vcf.gz # 生成索引文件 .tbi
参考面板下载:
• 千人基因组计划参考面板(1KGP):wget ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/
五、输出文件说明
• phased_output.vcf.gz
:分型/填充后的结果(bgzip压缩)。
• phased_output.log
:运行日志(检查错误和耗时)。
• phased_output.phased.vcf.gz
(旧版本可能生成此文件)。
六、常见问题
1. 内存不足(OutOfMemoryError)
增加Java堆内存(如分配32GB):
java -Xmx32g -jar beagle.jar ...
2. 输入文件格式错误
• 错误信息:Invalid VCF header
或 Could not read input file
• 解决:
- 用
bcftools
验证文件:bcftools view input.vcf.gz
- 确保文件用
bgzip
(而非gzip
)压缩。
3. 参考面板与目标数据不兼容
• 表现:填充后结果异常或报错。
• 解决:确保参考面板和目标数据的基因组版本一致(如 hg19 vs. hg38)。
七、参考资源
• 官方文档:http://faculty.washington.edu/browning/beagle/beagle_5.4_08Jul22.pdf
• 示例数据集:https://github.com/chrchang/beagle-examples
beagle 的使用方法和参数信息的更多相关文章
- Mui中mui.openWindow()方法具体参数信息(内容来自Mui问题专区)
mui.openWindow({ url: 'xxx.html', //String类型,要打开的界面的地址 id: 'id', //String类型,要打开的界面的id styles: { //We ...
- APK自我保护方法
标 题: [原创]APK自我保护方法 作 者: MindMac 时 间: 2013-12-28,21:41:15 链 接: http://bbs.pediy.com/showthread.php?t= ...
- 【JVM虚拟机】(8)--深入理解Class中--方法、属性表集合
#[JVM虚拟机](8)--深入理解Class中--方法.属性表集合 之前有关class文件已经写了两篇博客: 1.[JVM虚拟机](5)---深入理解JVM-Class中常量池 2.[JVM虚拟机] ...
- Aop实现拦截方法参数
对于spring框架来说,最重要的两大特性就是AOP 和IOC. 以前一直都知道有这两个东西,在平时做的项目中也常常会涉及到这两块,像spring的事务管理什么的,在看了些源码后,才知道原来事务管理也 ...
- java反射——方法
大家都知道反射技术在Java里面时非常重要的一个技术点,因为Java好多框架的编写都是基于反射的,别的不多说,spring框架里面的IOC就是基于反射实现.那么什么是反射呢?JAVA反射机制是在运行状 ...
- android黑科技系列——获取加固后应用App的所有方法信息
一.前言 在逆向应用的时候,我们有时候希望能够快速定位到应用的关键方法,在之前我已经详细介绍了一个自己研发的代码动态注入工具icodetools,来进行动态注入日志信息到应用中,不了解的同学可以查看这 ...
- mybatis源码探索笔记-3(使用代理mapper执行方法)
前言 前面两章我们构建了SqlSessionFactory,并通过SqlSessionFactory创建了我们需要的SqlSession,并通过这个SqlSession获取了我们需要的代理mapper ...
- Java Record 的一些思考 - 默认方法使用以及基于预编译生成相关字节码的底层实现
快速上手 Record 类 我们先举一个简单例子,声明一个用户 Record. public record User(long id, String name, int age) {} 这样编写代码之 ...
- 【腾讯Bugly干货分享】移动App入侵与逆向破解技术-iOS篇
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/577e0acc896e9ebb6865f321 如果您有耐心看完这篇文章,您将懂 ...
- 用Android Studio开发最常用到的快捷键
Android Studio常用快捷键 Android Studio日常开发常用快捷键. 快捷键版本: Mac OS X 10.5+ 搜索查看类 用途 Mac快捷键 搜索所有文件 double Shi ...
随机推荐
- Linux驱动---LED
目录 一.pinctrl子系统 二.GPIO子系统 三.GPIO操作步骤 3.1.获取GPIO描述符 3.2.设置方向 3.3.读写值 四.编写LED驱动 4.1.硬件原理图 4.2.修改设备树 4. ...
- 基于iscsi存储池
命令行 [root@kvm1 ~]# virsh pool-define-as --name stor2 --type iscsi \ > --source-host 192.168.114.1 ...
- RabbitMQ(七)——主题模式
RabbitMQ系列 RabbitMQ(一)--简介 RabbitMQ(二)--模式类型 RabbitMQ(三)--简单模式 RabbitMQ(四)--工作队列模式 RabbitMQ(五)--发布订阅 ...
- 最新demo版 | 如何0-1开发支付宝小程序之小程序页面功能介绍(三)
前两期讲了小程序开发的准备工作以及前期需要如何调试,今天我们就来介绍下开发一个支付宝小程序页面需要了解哪些信息. 一个小程序页面的整体功能的构成离不开页面展示(AXML).页面样式(ACSS)以及页面 ...
- 精选4款基于.NET开源、功能强大的通讯调试工具
前言 今天大姚给大家分享4款基于.NET开源.功能强大的通讯调试工具,旨在帮助.NET开发者们更好的应对通讯调试方面的学习和工作,提升调试效率. LLCOM LLCOM是一个.NET开源的.功能强大的 ...
- KUKA库卡机器人保养维修
KUKA机器人由机械手和控制柜组成,每日机器人保养包括:控制箱.教导盒.手腕之表面擦拭,还有噴槍之清洁. KUKA机器人控制柜保养1)断掉控制柜的所有供电电源.2)检查主机板.存储板.计算板.以及驱动 ...
- Thymeleaf Split
<th:block th:each="image : ${#strings.listSplit(goods.images, ';')}"> <img th:src ...
- Sqoop2 - [01] 安装部署
1.启动Hadoop集群 2.将Sqoop2的安装包上传到合适的目录中解压 tar -zxvf sqoop-1.99.7-bin-hadoop200.tar.gz 3.修改Hadoop的配置文件cor ...
- WordPress域名更换小记
WordPress域名更换记录 1.准备工作 在开始之前,要有一个全面的备份,包括网站的文件和数据库.这确保了如果出现问题,你可以恢复到更改之前的状态.不然中间卡壳直接连后台都打不开了,只能重装. ...
- ubuntu网络连接失败
首先要保证pc上可以连接上网络,然后进行下面的操作: 1.首先选择VMware的编辑选项 2.选择虚拟网络编辑器 3.还原默认设置,等待几分钟,确定就可以解决了