Every now and again someone comes along and writes an R package that I consider to be a 'game changer' for the language and it's application to Data Science. For example, I consider dplyr one such package as it has made data munging/manipulation that…
http://www.sthda.com/english/wiki/create-and-format-word-documents-using-r-software-and-reporters-package Install and load the ReporteRs R package Create a simple Word document Add texts : title and paragraphs of texts Format the text of a Word docum…
R 安装sparklyr,ggplot2等包出现如下warning package '****' is not available (for R version 3.0.2) 系统环境 ubuntu14.04 上述问题纠结了我很久,尝试过自己安装packages.zip包,出现了版本不对的报错 this R is version 3.0.2, package 'ggplot2' requires R >= 3.1 于是考虑到升级系统,猜测可能是底层依赖以及R的版本过低,于是运行如下命令在我的电脑…
利用data.table包变形数据 一. 基础概念 data.table 这种数据结构相较于R中本源的data.frame 在数据处理上有运算速度更快,内存运用更高效,可认为它是data.frame 的升级版.同时,data.table 包具备更多更强的功能,它基本工作形式是, dt [i, j, by] dt 为data.table 结构 i 为行,j 为列,by 为分组 二. 创建 data.table 和data.frame一样,如下: data.table(a=c(1, 2), b=c(…
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books  by Yoshua Bengio, Ian Goodfellow and Aaron Courville Neural Networks and Deep Learning42 by Michael Nielsen Deep Learning27 by Microsoft Research Deep Learning Tutorial23 by LISA lab, University…
##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.com/ty4z2008/Qix/blob/master/dl.md)共500条,[篇目二](https://github.com/ty4z2008/Qix/blob/master/dl2.md)开始更新------#####希望转载的朋友**一定要保留原文链接**,因为这个项目还在继续也在不定期更新.希望看到…
INTRODUCTION GPUs (Graphic Processing Units) have become much more popular in recent years for computationally intensive calculations.  Despite these gains, the use of this hardware has been very limited in the R programming language.  Although possi…
Introduction Deep learning is a recent trend in machine learning that models highly non-linear representations of data. In the past years, deep learning has gained a tremendous momentum and prevalence for a variety of applications (Wikipedia 2016a).…
SparkR (R on Spark) 概述 SparkDataFrame 启动: SparkSession 从 RStudio 来启动 创建 SparkDataFrames 从本地的 data frames 来创建 SparkDataFrames 从 Data Sources(数据源)创建 SparkDataFrame 从 Hive tables 来创建 SparkDataFrame SparkDataFrame 操作 Selecting rows(行), columns(列) Groupin…
sklearn实战-乳腺癌细胞数据挖掘(博客主亲自录制视频教程) https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with…
R in Nutshell 前言 例子(nutshell包) 本书中的例子包括在nutshell的R包中,使用数据,需加载nutshell包 install.packages("nutshell") 第一部分:基础 第一章 批处理(Batch Mode) R provides a way to run a large set of commands in sequence and save the results to a file. 以batch mode运行R的一种方式是:使用系统…
一.初学入门:<R in Action><The Art of_R Programming>入门者可首选两本,前者从统计角度入手,分高中低三部分由浅入深的讲解了如何用R来实现统计分析,另外此书已经有中文版面世.后者从程序编写的角度入手,对R的本身特点进行了清晰的介绍.中文版应该快有了.二.统计进阶:<A Handbook of Statistical Analyses_Using_R><Modern Applied Statistics With S>这两本…
Teach Yourself Programming in Ten Years——用十年教会自己编程 作者:Peter Norvig 译者:刘海粟 本文原文为:http://norvig.com/21-days.html 该翻译文档的PDF版可以在这里获得:http://download.csdn.net/source/2983778 为何万事都如此仓促? 随便走进一家书店,你就能看到<7天学会Java>以及各种万变不离其宗的书籍,形如:在数天或是数小时内学会Visual Basic.Wind…
I have been using R recently. R is statistics programming language. R has attracted more and more attention as analytics in cloud gets more and more hot. Don't install R in default ubuntu source which only contains a older version. Update apt source…
买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: <R语言编程艺术>The Art of R Programming <R语言初学者使用>A Beginner’s Guide to R <R语言实战>R in Action 一句话简介R语言:R是一种用于数据处理和统计分析的脚本语言,它受到由AT&T实验室开发的统计语言S(Statistics)的启发,且基本上兼容于S语言. 下载并安装R 从google中搜索R,第一个搜索结果就是R语言的网站…
本文在Creative Commons许可证下发布. 在fedora Linux上断断续续使用R语言过了9年后,发现R语言在国内用的人逐渐多了起来.由于工作原因,直到今年暑假一个赴京工作的机会与一位统计专业的人士聊天,才知道R语言的强大威力!(当然这里没有贬低SPSS, SAS,Stata的意思). R语言是用于统计分析.绘图的语言和操作环境.R是属于GNU系统的一个自由.免费.源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具.它是统计领域广泛使用的诞生于 1980年左右的 S 语言的…
[怪毛匠子整理] 1.下载 wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz 2.解压: tar -zxvf R-3.0.1.tar.gz cd R-3.0.1 3.安装 yum install readline-devel yum install libXt-devel ./configure 如果使用rJava需要加上 --enable-R-shlib ./configure  --enable-R-shlib -…
#学习 R 的方法 知识和耐心,是成为强者的唯一方法. - 通过阅读来学习.包括了阅读经典的教材.代码.论文.学习公开课.- 通过牛人来学习.包括同行的聚会.讨论.大牛的博客.微博.twitter.RSS.- 通过练习来学习.包括代码练习题.参加kaggle比赛.解决实际工作中的难题.- 通过分享来学习.包括自己写笔记.写博客.写书.翻译书,和同伴分享交流.培训新人. #阅读清单# 一.初学入门:<R in Action>从统计角度入手,分高中低三部分由浅入深的讲解了如何用R来实现统计分析.…
因为工作的原因,最近打算看一些分布式学习的资料.其中这个http://book.mixu.net/distsys/就是一篇非常适合分布式入门的介绍. 这个短小的材料有下面5个小的章节,图文并茂,也没有太难的概念,非常推荐. 基础知识.主要是一些基本概念,例如可扩展性(scalability),可用性(availability)(马上就要写成bilibili了),性能(performance),容错(fault tolerance). 上下层的抽象.CAP,敲黑板,这个是个很入门和重要的理论. 时…
From: http://xccds1977.blogspot.com/2013/02/r.html http://www.1point3acres.com/bbs/thread-51301-1-1.html https://www.cnblogs.com/colipso/archive/2013/02/22/2922575.html   以前人的烦恼是没有书可读,现在人的烦恼是书太多了.关于R语言的书已经出版很多了,博主大约读过其中的四十多本,但是书在精,而不在多,学在透, 而不在速.把有限的…
probably Unix Shell scripts, Perl, or Python and R can be the best options. ---------- 1-python 2-R 3-perl ---------- I would say, Python AND R. Although, just python would be sufficient already, it has great capabilities (including bioinformatics li…
# Chinese translations for R package # Copyright (C) 2005 The R Foundation # This file is distributed under the same license as the PACKAGE package. # 陈斐 <feic@normipaiva.com>, 2006. # 邓小冬 DENG Xiaodong <xd_deng@hotmail.com>, 2015. # msgid &qu…
R 语言基本数据结构 首先让我们先进入 R 环境下: sudo R 赋值 R 中可以用 = 或者 <- 来进行赋值 ,<- 的快捷键是 alt + - . > a <- c(2,5,8) > a [1] 2 5 8 筛选 我们可以用下标来筛选,例如: > a[1:2] [1] 2 5 注意 R 语言的下标是从 1 开始的. 当然我们也可以用逻辑进行筛选,例如: > a[a>4] [1] 5 8 为了了解这个式子的原理,我们先看看 a>4 是什么: &g…
K最近邻(k-Nearest Neighbor,KNN)分类算法 R语言实现包:R语言中有kknn package实现了weighted k-nearest neighbor. 决策树: R语言实现决策树:rpart扩展包 iris.rp = rpart(Species~.,data = iris,method = "class")print(iris.rp)#输出模型结果 node), split, n, loss, yval, (yprob) * denotes terminal…
现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言. 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来.当然,这不是最好的学习方式,最好的方式是——看书.目前,市面上介绍R语言的书籍很多,中文英文都有.那么,众多书籍中,一个生手应该从哪一本着手呢?入门之后如何才能把自己练就成某个方面的高手呢?相信这是很多人心中的疑问.有这种疑问的人…
A Complete Tutorial on Tree Based Modeling from Scratch (in R & Python) MACHINE LEARNING PYTHON R   SHARE      MANISH SARASWAT, APRIL 12, 2016 / 52     Introduction Tree based learning algorithms are considered to be one of the best and mostly used s…
包(package)是多个函数的集合,常作为分享代码的基本单元,代码封装成包可以方便其他用户使用.越来越多的R包正在由世界上不同的人所创建并分发,这些分发的R包,可以从CRAN 或 github 上获取,由于向 CRAN 提交包审核非常严格,有些开发者并没有将自己开发的R包提至CRAN的意向,通过 devtools 可以轻松从 github上下载安装.包的生命周期一般会经历 source.bundled.binary.installed和in-memory五个阶段.参考资料 (http://r-…
In two previous blog posts I discussed some techniques for visualizing relationships involving two or three variables and a large number of cases. In this tutorial I will extend that discussion to show some techniques that can be used on large datase…
每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- R语言·文本挖掘︱Rwordseg/rJava两包的安装 笔者:文本挖掘中这两个包可谓是"老顽固",做文本挖掘必须要过的关卡,今天倒腾了一天,桌面下了一堆东西,终于弄出来了.故此,赶紧记录下来,以后可用: 关于这两个包的安装问题,有很多很多教程,很多方法,我就不一一介绍,如果我介绍的方法你安装不了,那你就得去下面的参考链接找找其他的方…
1.1    预装的软件 (所有软件都可以在 http://www.biosino.org/R/R-doc/Rm/ 和 http://www.biosino.org/R/requiredSoftWares下载) 1.1.1          R 软件(R的官方下载:http://www.r-project.org/index.html:或者在我创建的一个本地非官方下载:http://www.biosino.org/R/R-doc/Rm/:) 1.1.2          Rtools(在Wind…