beagle 的使用方法和参数信息
一、基本使用场景
1. 单倍型推断(Phasing)
将未分型的基因型数据(如 VCF/BCF 文件)推断为单倍型。
java -jar beagle.jar \
gt=input.vcf.gz \ # 输入基因型数据(需bgzip压缩)
out=phased_output # 输出文件前缀(自动生成 .vcf.gz 和 .log)
2. 基因型填充(Imputation)
使用参考面板填充目标数据中的缺失基因型。
java -jar beagle.jar \
gt=target.vcf.gz \ # 待填充的目标数据
ref=reference.vcf.gz \ # 参考面板(如千人基因组)
out=imputed_output # 输出文件名前缀
二、核心参数说明
| 参数 | 作用 | 示例值 |
|---|---|---|
gt |
输入基因型数据(VCF/BCF) | gt=data.vcf.gz |
ref |
参考面板文件(用于填充) | ref=1kgp.vcf.gz |
out |
输出文件前缀 | out=result |
nthreads |
使用的CPU线程数 | nthreads=4 |
window |
分析窗口大小(cM) | window=40 |
impute |
强制填充缺失基因型 | impute=true |
Xmx |
Java堆内存分配 | java -Xmx8g -jar beagle.jar ... |
三、进阶使用示例
1. 使用参考面板和外部遗传图谱
java -jar beagle.jar \
gt=target.vcf.gz \
ref=reference.vcf.gz \
map=genetic_map.b37.txt \ # 遗传图谱文件(染色体位置→cM)
out=imputed_with_map
2. 多线程加速(推荐用于大型数据)
java -Xmx16g -jar beagle.jar \ # 分配 16GB 内存
gt=large_data.vcf.gz \
nthreads=8 \ # 使用8个CPU线程
out=fast_phasing
四、输入文件准备
VCF文件压缩和索引:
bgzip input.vcf # 压缩为 .vcf.gz
tabix -p vcf input.vcf.gz # 生成索引文件 .tbi
参考面板下载:
• 千人基因组计划参考面板(1KGP):wget ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/
五、输出文件说明
• phased_output.vcf.gz:分型/填充后的结果(bgzip压缩)。
• phased_output.log:运行日志(检查错误和耗时)。
• phased_output.phased.vcf.gz(旧版本可能生成此文件)。
六、常见问题
1. 内存不足(OutOfMemoryError)
增加Java堆内存(如分配32GB):
java -Xmx32g -jar beagle.jar ...
2. 输入文件格式错误
• 错误信息:Invalid VCF header 或 Could not read input file
• 解决:
- 用
bcftools验证文件:bcftools view input.vcf.gz
- 确保文件用
bgzip(而非gzip)压缩。
3. 参考面板与目标数据不兼容
• 表现:填充后结果异常或报错。
• 解决:确保参考面板和目标数据的基因组版本一致(如 hg19 vs. hg38)。
七、参考资源
• 官方文档:http://faculty.washington.edu/browning/beagle/beagle_5.4_08Jul22.pdf
• 示例数据集:https://github.com/chrchang/beagle-examples
beagle 的使用方法和参数信息的更多相关文章
- Mui中mui.openWindow()方法具体参数信息(内容来自Mui问题专区)
mui.openWindow({ url: 'xxx.html', //String类型,要打开的界面的地址 id: 'id', //String类型,要打开的界面的id styles: { //We ...
- APK自我保护方法
标 题: [原创]APK自我保护方法 作 者: MindMac 时 间: 2013-12-28,21:41:15 链 接: http://bbs.pediy.com/showthread.php?t= ...
- 【JVM虚拟机】(8)--深入理解Class中--方法、属性表集合
#[JVM虚拟机](8)--深入理解Class中--方法.属性表集合 之前有关class文件已经写了两篇博客: 1.[JVM虚拟机](5)---深入理解JVM-Class中常量池 2.[JVM虚拟机] ...
- Aop实现拦截方法参数
对于spring框架来说,最重要的两大特性就是AOP 和IOC. 以前一直都知道有这两个东西,在平时做的项目中也常常会涉及到这两块,像spring的事务管理什么的,在看了些源码后,才知道原来事务管理也 ...
- java反射——方法
大家都知道反射技术在Java里面时非常重要的一个技术点,因为Java好多框架的编写都是基于反射的,别的不多说,spring框架里面的IOC就是基于反射实现.那么什么是反射呢?JAVA反射机制是在运行状 ...
- android黑科技系列——获取加固后应用App的所有方法信息
一.前言 在逆向应用的时候,我们有时候希望能够快速定位到应用的关键方法,在之前我已经详细介绍了一个自己研发的代码动态注入工具icodetools,来进行动态注入日志信息到应用中,不了解的同学可以查看这 ...
- mybatis源码探索笔记-3(使用代理mapper执行方法)
前言 前面两章我们构建了SqlSessionFactory,并通过SqlSessionFactory创建了我们需要的SqlSession,并通过这个SqlSession获取了我们需要的代理mapper ...
- Java Record 的一些思考 - 默认方法使用以及基于预编译生成相关字节码的底层实现
快速上手 Record 类 我们先举一个简单例子,声明一个用户 Record. public record User(long id, String name, int age) {} 这样编写代码之 ...
- 【腾讯Bugly干货分享】移动App入侵与逆向破解技术-iOS篇
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/577e0acc896e9ebb6865f321 如果您有耐心看完这篇文章,您将懂 ...
- 用Android Studio开发最常用到的快捷键
Android Studio常用快捷键 Android Studio日常开发常用快捷键. 快捷键版本: Mac OS X 10.5+ 搜索查看类 用途 Mac快捷键 搜索所有文件 double Shi ...
随机推荐
- 无分类有tag
1 2
- [CF603E] Pastoral Oddities 题解
注意力惊人的注意到我们可以将问题转化为所有联通块大小全部为偶数. 假如已经确认了所有加入的边,那么我们可以通过类似 \(K\) 算法的方式求解. 考虑到答案单调不升,所以每条边都有一个影响的区间.考虑 ...
- nginx 强制https
nginx 强制https 通常有如下两种方法强制https推荐第二种,第二种更高效1.使用nginx的rewrite方法 server { listen 80; server_name xxx. ...
- 【Unity】投影矩阵和线性深度推导
[Unity]投影矩阵和线性深度推导 网络上有很多投影矩阵的推导,也有很多声称是基于 Unity 的,但和我的实测都不一致(现在看来是因为这些文章并不全面),此外有一些 Unity 本身的函数我也搞不 ...
- Typecho输出html颜色字教程
!!! 这里是红色 !!! !!! 这里是绿色 !!! typecho输出html教程 只需要用!!!包裹html即可实现! 用法 !!! <font color="red" ...
- 提供一个纯C语言的图像压缩程序,但是要达到将6MB的图片压缩到100KB以内的要求,有损压缩肯定是必须的。同时,要在速度上有所提升,我可以为您提供一个基于多线程的图像压缩程序。
提供一个纯C语言的图像压缩程序,但是要达到将6MB的图片压缩到100KB以内的要求,有损压缩肯定是必须的.同时,要在速度上有所提升,我可以为您提供一个基于多线程的图像压缩程序. 首先,我们需要了解一下 ...
- python 二级 第三方库
爬虫:rs 1.requests:链接访问 2.scrapy:系统构建.数据挖掘.网络监控.自动化 数据分析方向 nsp 1.numpy :数组 .科学计算.c语言编写 2.scipy:科学.数学.工 ...
- Selenium KPI接口 附件上传
实现功能 拖拽图片到百度上传图片搜索功能区域. 定位.send_keys(r'图片路径') 导入相关包 from selenium import webdriver from time import ...
- StarRocks 升级注意事项
前段时间升级了生产环境的 StarRocks,从 3.3.3 升级到了 3.3.9,期间还是踩了不少坑所以在这里记录下. 因为我们的集群使用的是存算分离的版本,也是使用官方提供的 operator 部 ...
- SQL Server如何跟踪自动统计信息更新?
SQL Server数据库中,我们都清楚统计信息对于优化器来说非常重要.一般情况下,我们会开启"自动更新统计信息"(Auto Update Statistics)这个选项,以便数据 ...