R语言学习——数据合并及绘制密度分布曲线图
setwd("E:/08_cooperation/07_X-lab/06-Crosstalk/Aadapter_primer")
# 读取lane01.txt,并对其按列进行相加处理,然后对列进行进行命名
d1=read.table("lane01.txt",header = FALSE,sep = ",")
cyc001=d1$V3+d1$V4+d1$V5+d1$V6
d1=cbind(d1,cyc001)
names(d1)=c("cyc001x","cyc001y","cyc001A","cyc001T","cyc001C","cyc001G","cyc001")
# 读取lane06.txt,并对其按列进行相加处理,然后对列进行进行命名
d2=read.table("lane06.txt",header = FALSE,sep = ",")
cyc001=d2$V3+d2$V4+d2$V5+d2$V6
d2=cbind(d2,cyc001)
names(d2)=c("cyc001x","cyc001y","cyc001A","cyc001T","cyc001C","cyc001G","cyc001")
head(d1)
cyc001x cyc001y cyc001A cyc001C cyc001G cyc001T cyc001
1 29.20 2.94 798 697 831 1322 3648
2 83.36 3.51 1379 575 455 3185 5594
3 121.10 2.82 1049 377 371 4249 6046
4 150.12 2.42 1093 1317 1275 1157 4842
5 159.20 3.58 1124 993 428 5124 7669
6 194.29 2.63 1178 1007 372 1328 3885
head(d2)
cyc001x cyc001y cyc001A cyc001C cyc001G cyc001T cyc001
1 37.57 3.14 2374 6680 1337 1501 11892
2 108.90 3.11 3469 3720 528 5688 13405
3 270.51 4.34 6710 1868 1039 4087 13704
4 136.98 4.11 1753 11892 873 1656 16174
5 142.14 3.93 1677 2732 1366 3399 9174
6 234.00 4.00 1657 7318 727 1524 11226
#载入plyr包
library(plyr)
listA<-list()
listA[[1]] <- data.frame(t(d1$cyc001A))
listA[[2]] <- data.frame(t(d2$cyc001A))
A<-t(rbind.fill(listA))
colnames(A)<-c("lane01_A","lane06_A")
write.table(A,file="intsfile_A.txt")
listT<-list()
listT[[1]]<-data.frame(t(d1$cyc001T))
listT[[2]]<-data.frame(t(d2$cyc001T))
T<-t(rbind.fill(listT))
colnames(T)<-c("lane01_T","lane06_T")
write.table(T,file="intsfile_T.txt")
listC <- list()
listC[[1]] <- data.frame(t(d1$cyc001C))
listC[[2]] <- data.frame(t(d2$cyc001C))
C<- t(rbind.fill(listC))
colnames(C) <-c("lane01_C","lane06_C")
write.table(C,file="intsfile_C.txt")
listG <- list()
listG[[1]] <- data.frame(t(d1$cyc001G))
listG[[2]] <- data.frame(t(d2$cyc001G))
G<- t(rbind.fill(listG))
colnames(G) <-c("lane01_G","lane06_G")
write.table(G,file="intsfile_G.txt")
listCyc <- list()
listCyc[[1]] <- data.frame(t(d1$cyc001))
listCyc[[2]] <- data.frame(t(d2$cyc001))
ATCG<- t(rbind.fill(listCyc))
colnames(ATCG) <-c("lane01","lane06")
write.table(ATCG,file="intsfile_ATCG.txt")
list.files()
[1] "201811271857_lane06_8mix_10A_100B2" "201904171659_B028___Lane01_03_05"
[3] "intsfile_A.txt" "intsfile_ATCG.txt"
[5] "intsfile_C.txt" "intsfile_G.txt"
[7] "intsfile_T.txt" "lane01.txt"
[9] "lane06.txt"
library(wordcloud2)
library(gcookbook)
library(ggplot2)
library(reshape2)
data=read.table("intsfile_ATCG.txt",header = T)
data1=melt(data,variable.name="lane",value.name="ints")
ggplot(data1,aes(x=ints,colour=lane))+geom_density(adjust=1)+ggtitle("A Adapter VS A Primer(Base_A)")+theme(plot.title=element_text(size=rel(1.2),hjust = 0.5,family="Times"))+scale_x_continuous(limits = c(0,60000),breaks = c(0,5000,10000,15000,20000,30000,40000,50000,60000))+scale_y_continuous("desity(%)",limits = c(0,0.0003),breaks = c(0.00000,0.00005,0.00010,0.00015,0.00020,0.00030),labels = c(0.00000,0.00005,0.00010,0.00015,0.00020,0.00030)*100)
R语言学习——数据合并及绘制密度分布曲线图的更多相关文章
- R语言学习——数据框
> #数据框可以包含不同模式(数值型.字符型.逻辑型等)的数据,是R中最常处理的数据结构.数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,c ...
- R语言学习 第四篇:函数和流程控制
变量用于临时存储数据,而函数用于操作数据,实现代码的重复使用.在R中,函数只是另一种数据类型的变量,可以被分配,操作,甚至把函数作为参数传递给其他函数.分支控制和循环控制,和通用编程语言的风格很相似, ...
- R语言进行数据预处理wranging
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with R packages:tidyr dplyr Ground rules ...
- R语言学习笔记(一)
1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的 ...
- R语言学习——根据信息熵建决策树KD3
R语言代码 决策树的构建 rm(list=ls()) setwd("C:/Users/Administrator/Desktop/R语言与数据挖掘作业/实验3-决策树分类") #s ...
- R语言进行数据预处理
R语言进行数据预处理wranging li_volleyball 2016年3月22日 data wrangling with Rpackages:tidyr dplyr Ground rules l ...
- R语言学习笔记1——R语言中的基本对象
R语言,一种自由软件编程语言与操作环境,主要用于统计分析.绘图.数据挖掘.R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发(也因此称为R),现在由“R开发核心 ...
- R语言 我要如何开始R语言_数据分析师
R语言 我要如何开始R语言_数据分析师 我要如何开始R语言? 很多时候,我们的老板跟我们说,这个东西你用R语言去算吧,Oh,My god!什么是R语言?我要怎么开始呢? 其实回答这个问题很简单,首先, ...
- 用R语言提取数据框中日期对应年份(列表转矩阵)
用R语言提取数据框中日期对应年份(列表转矩阵) 在数据处理中常会遇到要对数据框中的时间做聚类处理,如从"%m/%d/%Y"中提取年份. 对应操作为:拆分成列表——列表转矩阵——利用 ...
随机推荐
- 网卡的 Ring Buffer 详解
1. 网卡处理数据包流程 网卡处理网络数据流程图: 图片来自参考链接1 上图中虚线步骤的解释: DMA 将 NIC 接收的数据包逐个写入 sk_buff ,一个数据包可能占用多个 sk_buff , ...
- 蓝牙协议中的SBC编解码原理和仿真
一.SBC的原理 SBC是subband codec的缩写,中文叫做次频带编码,也叫子带编码.其基本原理是把信号的频率分为若干子带,然后对每个子带进行编码,并根据每个子带的重要性及特点分配不同的位数( ...
- 字典fromkeys方法和update方法
#Author : Kelvin #Date : 2019/1/17 15:27 #字典的update方法,是向调用者字典中添加另外一个字典 dict1 = {"name":&qu ...
- 当 “HTTP” 先生遇上“S”小姐
情人节的晚上,天空中淅淅沥沥的下着带有些寒意的小雨.HTTP 先生孤零零的坐在咖啡厅中,对着面前的电脑发呆.他有意的屏蔽掉了周边情侣们的窃窃私语,这对单身的他来说是狗粮,也是一阵阵伤害.这时,咖啡厅的 ...
- MyWebViewDemo【封装Webview常用配置和选择文件、打开相机、录音、打开本地相册的用法】
版权声明:本文为HaiyuKing原创文章,转载请注明出处! 前言 封装webview的常用配置和选择文件.打开相机.录音.打开本地相册的用法.[如果想要使用简单的预览功能,可以参考<MyBri ...
- Wolsey "强整数规划“ 建模的+Leapms实践——无产能批量问题
Wolsey "强整数规划“ 建模的+Leapms实践——无产能批量问题 <整数规划>[1]一书作者L. A. Wolsey对批量问题(Lot-sizing Problem)做了 ...
- Docker进阶之二:Docker内部组件
Docker内部组件 一.Namespaces 命名空间,Linux内核提供的一种对进程资源隔离的机制,例如进程,网络,挂载点等资源. docker run -d busybox ping ba ...
- #6 判断一个数是否为2的n次方
「ALBB面试题」 [题目] 如何判断一个数是否为2的n次方 [题目分析] 看到这种题,相信大家第一反应就是循环除2,这样做肯定是可以得出结果的:但是这种做法无疑大大增加了计算机的运行时间,一个非常大 ...
- 点击菜单选项,右侧主体区新增子界面(Tab)的实现
今天是2019年小年后一天,还有三天回家过年. 今天记录一下一种前端页面的效果的实现,这种效果很常见,一般用于网站后台系统的前端页面.一般后台系统会分为顶部导航栏,左边的菜单栏和右边的主体区.有一种效 ...
- DS控件库 DS按钮多种样式
在DS控件库(DSControls)中,DS按钮的功能非常多,通过设置不同的属性值来使按钮呈现不同的效果.DS按钮的常用属性如下: 使用不同的属性调出不同的外观样式示例