beagle 的使用方法和参数信息
一、基本使用场景
1. 单倍型推断(Phasing)
将未分型的基因型数据(如 VCF/BCF 文件)推断为单倍型。
java -jar beagle.jar \
gt=input.vcf.gz \ # 输入基因型数据(需bgzip压缩)
out=phased_output # 输出文件前缀(自动生成 .vcf.gz 和 .log)
2. 基因型填充(Imputation)
使用参考面板填充目标数据中的缺失基因型。
java -jar beagle.jar \
gt=target.vcf.gz \ # 待填充的目标数据
ref=reference.vcf.gz \ # 参考面板(如千人基因组)
out=imputed_output # 输出文件名前缀
二、核心参数说明
| 参数 | 作用 | 示例值 |
|---|---|---|
gt |
输入基因型数据(VCF/BCF) | gt=data.vcf.gz |
ref |
参考面板文件(用于填充) | ref=1kgp.vcf.gz |
out |
输出文件前缀 | out=result |
nthreads |
使用的CPU线程数 | nthreads=4 |
window |
分析窗口大小(cM) | window=40 |
impute |
强制填充缺失基因型 | impute=true |
Xmx |
Java堆内存分配 | java -Xmx8g -jar beagle.jar ... |
三、进阶使用示例
1. 使用参考面板和外部遗传图谱
java -jar beagle.jar \
gt=target.vcf.gz \
ref=reference.vcf.gz \
map=genetic_map.b37.txt \ # 遗传图谱文件(染色体位置→cM)
out=imputed_with_map
2. 多线程加速(推荐用于大型数据)
java -Xmx16g -jar beagle.jar \ # 分配 16GB 内存
gt=large_data.vcf.gz \
nthreads=8 \ # 使用8个CPU线程
out=fast_phasing
四、输入文件准备
VCF文件压缩和索引:
bgzip input.vcf # 压缩为 .vcf.gz
tabix -p vcf input.vcf.gz # 生成索引文件 .tbi
参考面板下载:
• 千人基因组计划参考面板(1KGP):wget ftp://ftp.1000genomes.ebi.ac.uk/vol1/ftp/release/20130502/
五、输出文件说明
• phased_output.vcf.gz:分型/填充后的结果(bgzip压缩)。
• phased_output.log:运行日志(检查错误和耗时)。
• phased_output.phased.vcf.gz(旧版本可能生成此文件)。
六、常见问题
1. 内存不足(OutOfMemoryError)
增加Java堆内存(如分配32GB):
java -Xmx32g -jar beagle.jar ...
2. 输入文件格式错误
• 错误信息:Invalid VCF header 或 Could not read input file
• 解决:
- 用
bcftools验证文件:bcftools view input.vcf.gz
- 确保文件用
bgzip(而非gzip)压缩。
3. 参考面板与目标数据不兼容
• 表现:填充后结果异常或报错。
• 解决:确保参考面板和目标数据的基因组版本一致(如 hg19 vs. hg38)。
七、参考资源
• 官方文档:http://faculty.washington.edu/browning/beagle/beagle_5.4_08Jul22.pdf
• 示例数据集:https://github.com/chrchang/beagle-examples
beagle 的使用方法和参数信息的更多相关文章
- Mui中mui.openWindow()方法具体参数信息(内容来自Mui问题专区)
mui.openWindow({ url: 'xxx.html', //String类型,要打开的界面的地址 id: 'id', //String类型,要打开的界面的id styles: { //We ...
- APK自我保护方法
标 题: [原创]APK自我保护方法 作 者: MindMac 时 间: 2013-12-28,21:41:15 链 接: http://bbs.pediy.com/showthread.php?t= ...
- 【JVM虚拟机】(8)--深入理解Class中--方法、属性表集合
#[JVM虚拟机](8)--深入理解Class中--方法.属性表集合 之前有关class文件已经写了两篇博客: 1.[JVM虚拟机](5)---深入理解JVM-Class中常量池 2.[JVM虚拟机] ...
- Aop实现拦截方法参数
对于spring框架来说,最重要的两大特性就是AOP 和IOC. 以前一直都知道有这两个东西,在平时做的项目中也常常会涉及到这两块,像spring的事务管理什么的,在看了些源码后,才知道原来事务管理也 ...
- java反射——方法
大家都知道反射技术在Java里面时非常重要的一个技术点,因为Java好多框架的编写都是基于反射的,别的不多说,spring框架里面的IOC就是基于反射实现.那么什么是反射呢?JAVA反射机制是在运行状 ...
- android黑科技系列——获取加固后应用App的所有方法信息
一.前言 在逆向应用的时候,我们有时候希望能够快速定位到应用的关键方法,在之前我已经详细介绍了一个自己研发的代码动态注入工具icodetools,来进行动态注入日志信息到应用中,不了解的同学可以查看这 ...
- mybatis源码探索笔记-3(使用代理mapper执行方法)
前言 前面两章我们构建了SqlSessionFactory,并通过SqlSessionFactory创建了我们需要的SqlSession,并通过这个SqlSession获取了我们需要的代理mapper ...
- Java Record 的一些思考 - 默认方法使用以及基于预编译生成相关字节码的底层实现
快速上手 Record 类 我们先举一个简单例子,声明一个用户 Record. public record User(long id, String name, int age) {} 这样编写代码之 ...
- 【腾讯Bugly干货分享】移动App入侵与逆向破解技术-iOS篇
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/577e0acc896e9ebb6865f321 如果您有耐心看完这篇文章,您将懂 ...
- 用Android Studio开发最常用到的快捷键
Android Studio常用快捷键 Android Studio日常开发常用快捷键. 快捷键版本: Mac OS X 10.5+ 搜索查看类 用途 Mac快捷键 搜索所有文件 double Shi ...
随机推荐
- 用virtual-manager安装虚拟机
使用virt-manager基本使用 启用机管理主窗口 硬件细节窗口 配置虚拟机启动选项 附加USB设备给虚拟机准备工作 USB重定向 虚拟机图形控制台 添加远程连接 显示虚拟机细节 性能监视 实验准 ...
- WPF的Dispatcher类里的BeginInvoke,Invoke,InvokeAsync
原文地址:https://blog.csdn.net/niuge8905/article/details/81117989 深入了解 WPF Dispatcher 的工作原理(Invoke/Invok ...
- error setting certificate verify locations: CAfile: C:/Program Files/Git/mingw64/ssl/certs/ca-bundle.crt CApath: none
这个问题是因为git配置里crt证书的路径不正确导致的. 这个路径配置是在C:\Program Files\Git\etc\gitconfig中,应该所有人的配置都在这里 [diff "as ...
- 八米云-N1盒子、S905系列机顶盒等设备-小白保姆式超详细刷机教程
线刷准备 这里以魔百盒CM211-1为例,本次刷机用到的零碎工具比较多,不过都是常见刚需设备,大家可以按照清单核对一下. 目前只支持S905 L3.L3a.L2 系列的各种盒子 机顶盒本体 电脑一台 ...
- 记一次.NET内存居高不下排查解决与启示
前情 我们有个海外的项目,一共70个服务,前前后后花了超过一年时间完成了云服务迁移和架构调整.主要是架构调整了,原来的docker swarm托管服务,新架构改为Kubernetes托管.几台云服务器 ...
- C语言(数据结构)时间标记
数据结构 时间标记 循环输出1~N的数: #include<stdio.h>#include<time.h>clock_t start,stop;//clock_t是clock ...
- 最简单的方式:如何在wsl2上配置CDUA开发环境
step0:序言 这篇文章可以帮助你以一个最为简单的方式迈出CUDA的第一步,从此一入CUDA深似海,从此头发是路人. 前提:你需要在Windows 11上: 电脑中有nvidia显卡以及驱动,由于w ...
- IDEA激活后提示We could not validate your license xxxx解决办法
示例报错样式:每次激活单开都会不断弹出--很烦 解决思路是拦截jetbrains校验license的请求, 也就是找到校验license的接口屏蔽掉就行; > 别信网上的配置代理拦截 这样做 ...
- Linux下启动Oracle命令
1.进入LInux,切换到Oracle用户权限,输入数据库密码.su - oracle 1在这里插入图片描述2.输入sqlplus "/as sysdba" 1在这里插 ...
- 配置win + ubuntu双系统需要注意的一些点
配置win + ubuntu双系统需要注意的一些点 基本上是按照B站机器人工匠阿杰的视频来的,但是有一些需要注意的点值得关注. 关闭RST 首先是比较新的电脑bios里会有一个叫做英特尔 快速存储技术 ...