[转载请注明出处]http://www.cnblogs.com/mashiqi Today let's talk about a intuitive explanation of Benjamini-Hochberg Procedure. My teacher Can told me this explanation. Suppose there are $M$ hypothesis:$$H_1,H_2,\cdots,H_M$$and corresponding $M$ p-values:$$p…
文献名:Repeat-Preserving Decoy Database for False Discovery Rate Estimation in Peptide Identication (用于肽段鉴定中错误发生率估计的能体现重复性的诱饵数据库) 期刊名:Journal of Proteome Research 发表时间:(2020年3月) IF:3.78 单位: 滑铁卢大学计算机科学学院 多伦多细胞生物学和SPARC生物项目中心 多伦多大学分子遗传学系 技术:肽段鉴定,诱饵数据库构建 一…
An Intuitive Explanation of Convolutional Neural Networks https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/ Posted on August 11, 2016 by ujjwalkarn What are Convolutional Neural Networks and why are they important? Convolutional Neural…
What is an intuitive explanation of the relation between PCA and SVD? 36 FOLLOWERS Last asked: 30 Sep, 2014 QUESTION TOPICS Singular Value Decomposition Principal Component Analysis Intuitive Explanations Statistics (academic discipline) Machine Lear…
Reprinted from: http://cns-alumni.bu.edu/~slehar/fourier/fourier.html An Intuitive Explanation of Fourier Theory<a href="http://www.statcounter.com/" target="_blank"><img src="76366945-1c60-49f1-ac31-ff97990c217e_files/co…
https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/ An Intuitive Explanation of Convolutional Neural Networks Posted on August 11, 2016 by ujjwalkarn What are Convolutional Neural Networks and why are they important? Convolutional Neural…
An Intuitive Explanation of Convolutional Neural Networks 原文地址:https://ujjwalkarn.me/2016/08/11/intuitive-explanation-convnets/comment-page-4/?unapproved=31867&moderation-hash=1ac28e426bc9919dc1a295563f9c60ae#comment-31867 一.什么是卷积神经网络.为什么卷积神经网络很重要? 卷…
一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段中,假阳性的判断取决于蛋白鉴定的检索条件,包括谱图的质量,检索的数据库的大小,检索引擎,检索参数等.本文提出了一个一种依据蛋白鉴定条件设定假阳性的方法.该方法的可靠性在一个人工确认的包含546个蛋白的数据集中进行了验证.目前该方法已被封装成一个开源工具,TDCD_FDR_CALCULATOR,可以整…
  欢迎关注博主主页,学习python视频资源 sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 统计项目联系QQ:231469242 用条件概率理解混合矩阵容易得多 sensitivity:真阳性…
MAGENTA是一款计算工具,利用全基因组遗传数据,计算预先设定的涉及生物过程或者功能性基因集在遗传相关性的富集程度.开发的目的是分析基因型不是现成的数据集,比如大型的全基因组关联荟萃分析.在以下两种情况下可以使用:1,检验某个特定的假设:2,通过检测一系列已知的生物基因集(从不同的公共数据库提供的通路)提出某个假设. 输入文本格式:变体相关的P值和它们的染色体位置(数据从全基因组关联分析文件或者荟萃分析文件获得) 输出文本格式:针对给定的基因集或通路,计算出基因集富集分析后的P值和错误发现率(…
Source: http://mindhive.mit.edu/book/export/html 1. What is the multiple-comparison problem? What is familywise error correction (FWE)? To start, Nichols and Hayasaka (PthresholdPapers) provide an excellent introduction to the issue of FWE in neuroim…
来源: http://blog.sciencenet.cn/blog-479412-572049.html,http://52brain.com/thread-15512-1-1.html SPM8允许两种FDR校验.一个是voxel-wise FDR,另一个是topological FDR. 如果要做voxel-wise FDR 校验,就把spm_defaults里的68行的defaults.stats.topoFDR 改为0. (有很多朋友下载下来的spm在处理结果是只显示FWE矫正和NOR…
来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101l02a.html,http://wenku.baidu.com/link?url=3mRTbARl0uPHHRFO9CdqhBNeUj-nb8dRwtqRN2oGqu8u1kN6IsqgYy-H8ggB7jOkPXhx703oM9YW9ftfOlh2dz7KJmlliOhDa4-WZFEEus_,http://www.dxy.cn/bbs/thread/28263194#28263194 一.假设检验基…
https://en.wikipedia.org/wiki/Information_retrieval 信息检索 (一种信息技术) 信息检索(Information Retrieval)是指信息按一定的方式组织起来, 并根据信息用户的需要找出有关的信息的过程和技术.狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的 信息查寻(Information Search 或Information Seek).一般情况下,信息检索指的就是广义的信息检索. 信息…
读paper的时候觉得自己就是个24K纯学渣(=.=)一大堆问题等着我去解决...所以在这里写一个Q&A好了,先列问题,逐步填充答案- ××××××××××××××××××我是分割线么么哒××××××××××××××××××××××××××××××××××××××××××× 1. PCoA: Principal coordinates analysis 如何绘制的?原理如何? 2. FDR: false discovery rate 如何计算的? Ans: 在多重检验(multiple test…
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction.   Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要.剔除那些不重要的指标.   sklearn.feature_selection模块中主要有以下几个方法: SelectKBest和SelectPercentile比较相似,前者选择排名排…

FDR

声明: 网上摘抄 False discovery rate (FDR) control is a statistical method used in multiple hypothesis testing to correct for multiple comparisons. In a list of rejected hypotheses, FDR controls the expected proportion of incorrectly rejected null hypothese…
GWAS的数据形式:SNP数据,即各个SNP位点的aa,Aa,AA基因型与疾病状态(0正常,1患病)的样例-对照数据. 在遗传流行病学上,全基因组关联研究(Genome Wide Association Studies,GWAS)是一种检测特定物种中不同个体间的全部或大部分基因,从而了解不同个体间的基因变化有多大的一种方法.不同的变化带来不同的性状,如各种疾病的不同. 这些研究通常比较两组参与者的DNA:有疾病的人(病例)和相同条件的无该疾病的人(对照).每个人都提供些作为样本的细胞,如从口腔内…
Previously in this series: The beta distribution Empirical Bayes estimation Credible intervals The Bayesian approach to false discovery rates Bayesian A/B testing Beta-binomial regression Understanding empirical Bayesian hierarchical modeling Mixture…
feature_selection模块 Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标重要.剔除那些不重要的指标.   sklearn.feature_selection模块中主要有以下几个方法: SelectKBest和SelectPercentile比较相似,前者选择排名排在前n个的变量,后者选择排名排在前n%的变量.而他们通过什么指标来给变量排名呢?这需要二外的指定. 对于re…
  image Gene Set Enrichment Analysis (GSEA) is a computational method that determines whether an a priori defined set of genes shows statistically significant, concordant differences between two biological states (e.g. phenotypes). 用GSEA做富集分析是非常简单的,结…
P122, 这是IQR method课的第一次作业,需要统计检验,x和y是否显著的有线性关系. Assignment 1 1) Find a small bivariate dataset (preferably from your own discipline) and produce a scatterplot (this is easy using any spreadsheet) 2) Use any statistics tool (a calculator, spreadsheet…
目录 特征选择 (feature_selection) Filter 1. 移除低方差的特征 (Removing features with low variance) 2. 单变量特征选择 (Univariate feature selection) Wrapper 3. 递归特征消除 (Recursive Feature Elimination) Embedded 4. 使用SelectFromModel选择特征 (Feature selection using SelectFromMode…
sklearn实战-乳腺癌细胞数据挖掘(博主亲自录制视频) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share 项目合作QQ:231469242 变量筛选:(逻辑回归) 好处: 变量少,模型运行速度快,更容易解读和理解 坏处: 会牺牲掉少量精确性 变量不筛选:(r…
论文:Working hard to know your neighbor’s margins: Local descriptor learning loss  为什么介绍此文:这篇2018cvpr文章主要是从困难样本入手,提出的一个loss,简单却很有效,在图像匹配.检索.Wide baseline stereo等都做了大量详细实验,在真实任务中真正取得了state-of-the-art的结果.代码:https://github.com/DagnyT/hardnet .上一篇博客中的论文可以和…
RNA-seq是利器,大部分做实验的老板手下都有大量转录组数据,所以RNA-seq的分析需求应该是很大的(大部分的生信从业人员应该都差不多要沾边吧). 普通的转录组套路并不多,差异表达基因.富集分析.WGCNA network以及一些没卵用的花式分析.DEG分析是基础,up and down,做个富集,了解一下处理后到底是什么通路被改变了:WGCNA主要就是根据相关性来找出一些co-express的gene module. 单细胞的转录组的玩法就比较多了,可以理解为超多样本的普通转录组,普通转录…
学习笔记之scikit-learn - 浩然119 - 博客园 https://www.cnblogs.com/pegasus923/p/9997485.html 3. Model selection and evaluation — scikit-learn 0.20.3 documentation https://scikit-learn.org/stable/model_selection.html#model-selection Accuracy paradox - Wikipedia…
p值还是 FDR ? 差异分析 如何筛选显著性差异基因,p value, FDR 如何选 经常有同学询问如何筛选差异的基因(蛋白).已经计算了表达量和p value值,差异的基因(蛋白)太多了,如何筛选.其中最为关键的是需要对p value进行校正. 基本概念: 零假设:在随机条件下的分布. p值:在零假设下,观测到某一特定实验结果的概率称为p值. 假阳性:得到了阳性结果,但这个阳性结果是假的. 假阴性:得到了阴性结果,但这个阴性结果是假的. 单次检验: 针对单个基因(蛋白),采用统计检验,假设…
浅谈多重检验校正FDR Posted: 四月 12, 2017  Under: Basic  By Kai  no Comments 例如,在我们对鉴定到的差异蛋白做GO功能注释后,通常会计算一个p值.当某个蛋白的p值小于0.05(5%)时,我们通常认为这个蛋白在两个样本中的表达是有差异的.但是仍旧有5%的概率,这个蛋白并不是差异蛋白.那么我们就错误地否认了原假设(在两个样本中没有差异表达),导致了假阳性的产生(犯错的概率为5%). 如果检验一次,犯错的概率是5%:检测10000次,犯错的次数就…
差异表达分析之FDR 随着测序成本的不断降低,转录组测序分析已逐渐成为一种很常用的分析手段.但对于转录组分析当中的一些概念,很多人还不是很清楚.今天,小编就来谈谈在转录组分析中,经常会遇到的一个概念FDR,那什么是FDR?为什么要用FDR呢?一起来学习吧! 什么是FDR FDR (false discovery rate),中文一般译作错误发现率.在转录组分析中,主要用在差异表达基因的分析中,控制最终分析结果中,假阳性结果的比例. 为什么要用FDR 在转录组分析中,如何确定某个转录本在不同的样品…