R 实例1
//转载:http://www.r-china.net/forum.php?mod=viewthread&tid=881&extra=page%3D1
//用R抓取人民日报网数据 library(RCurl) for (i in :) {
base <- "http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/603000.phtml?year=2013&jidu="
jidu <- i
url <- paste(base,jidu,sep='') temp <- getURL(url)
k=strsplit(temp,"\r\n")[[]] #以list形式展现,方便以下操作 #抓取日期
timeadr <- k[grep("<a target='_blank'",k)+] #第1行 日期
time=substring(timeadr,,)
print(unlist(strsplit(time," "))) #抓取 开盘价,最高价,收盘价,最低价
for(j in :) #一个季度源代码中第3到6行
{ xxx <- k[grep("<a target='_blank'",k)+j] # 所需信息
xx <- gregexpr(">\\d+",xxx) #找出指定元素在本行第几位 for(m in :length(xxx))
{
yy=xx[[m]]
xxs=substring(xxx[m],yy+,yy+attr(yy,'match.length')+) #:6行+
print(xxs) #每次循环都输出该值
} } #抓取交易量
xxx=k[grep("<a target='_blank'",k)+] #抓取路径下第7行 交易量
xx=gregexpr(">\\d+",xxx) #找出指定元素在本行第几位
for(n in :length(xxx))
{
yy=xx[[n]]
xxs=substring(xxx[n],yy+,yy+attr(yy,'match.length')-) #:6行+ 7行- 8行-
print(xxs) #每次循环都输出该值
}
#抓取交易金额
xxx=k[grep("<a target='_blank'",k)+] #抓取路径下第8行 交易金额
xx=gregexpr(">\\d+",xxx) #找出指定元素在本行第几位
for(o in :length(xxx))
{
yy=xx[[o]]
xxs=substring(xxx[o],yy+,yy+attr(yy,'match.length')-) #:6行+ 7行- 8行-
print(xxs) #每次循环都输出该值
} }
需要的基础有:RCurl包及其函数,R字符处理,正则表达式
刚入门,学习中。。。
R 实例1的更多相关文章
- R语言高性能编程(三)
一.使用并行计算加倍提升性能1.数据并行 VS 任务并行实现数据并行的算法scoket 并行性注意并行计算时间并不与执行任务的计算资源数目成正比(计算机核心),amdahl定律:并行代码的速度受限于串 ...
- 方差分析 | ANOVA | 原理 | R代码 | 进阶 | one way and two way
原理 比较两组就用t-test,比较三组及以上就用ANOVA.注意:我们默认说的都是one way ANOVA,也就是对group的分类标准只有一个,比如case和control(ABCD多组),tw ...
- 让R与Python共舞
转载:http://ices01.sinaapp.com/?p=129 R(又称R语言)是一款开源的跨平台的数值统计和数值图形化展现 工具.通俗点说,R是用来做统计和画图的.R拥有自己的脚本 ...
- 《R实战》读书笔记二
第一章 R简单介绍 本章概要 1安装R 2理解R语言 3执行R程序 本章所介绍的内容概括例如以下. 一个典型的数据分析步骤如图1所看到的. 图1:典型数据分析步骤 简而言之,现今的数据分析要求我们从多 ...
- 快速入门:Python简单实例100个(入门完整版)
Python3 100例 文章目录 Python3 100例 实例001:数字组合 实例002:“个税计算” 实例003:完全平方数 实例004:这天第几天 实例005:三数排序 实例006:斐波那契 ...
- Python调用R编程——rpy2
在Python调用R,最常见的方式是使用rpy2模块. 简介 模块 The package is made of several sub-packages or modules: rpy2.rinte ...
- python100实例
实例001:数字组合 题目 有四个数字:1.2.3.4,能组成多少个互不相同且无重复数字的三位数?各是多少? 程序分析 遍历全部可能,把有重复的剃掉. total=0 for i in range(1 ...
- c/c++: c++继承 内存分布 虚表 虚指针 (转)
http://www.cnblogs.com/DylanWind/archive/2009/01/12/1373919.html 前部分原创,转载请注明出处,谢谢! class Base { pu ...
- c++继承中的内存布局
今天在网上看到了一篇写得非常好的文章,是有关c++类继承内存布局的.看了之后获益良多,现在转在我自己的博客里面,作为以后复习之用. ——谈VC++对象模型(美)简.格雷程化 译 译者前言 一个C ...
随机推荐
- Centos 7.1+CDH5.7.2全部署流程
前期准备: JDK环境 版本:jdk-8u101-linux-x64.rpm 下载地址:oracle官网 mysql rpm包:http://dev.mysql.com/get/Downloads/M ...
- phpMyAdmin安装
phpMyAdmin是MySql的一个Web操作界面. phpMyAdmin官网貌似被和谐了,经常无法访问.不过我们可以从GitHub下载phpMyAdmin. 然后解压,搭建与普通的PHP网站一样. ...
- mysql 修改字段长度
mysql 修改字段长度 alter table news modify column title varchar(130); alter table 表名 modify column 字段名 类型 ...
- Ubuntu14.04 切换root账户su root失败解决办法
原因是需要备份一个vimrc,可是cp就提示Permission denied. su root就提示su: Authentication failure 解决办法: sudo passwd root ...
- DevExpress XtraGrid 数据导出导入Excel
// <summary> /// 导出按钮 /// </summary> /// <param name="sender"></param ...
- 正整数转换成N进制的数组
给定一个正整数,按照N进制转换成数组元素存储 //给定一个整数,把它转换成按照N进制存储的数组 #include <stdio.h> #include <stdlib.h> # ...
- static关键字的作用
static可以用来定义静态成员变量.静态函数.静态代码块. 静态成员变量的语法特点 定义方法:在成员变量前面加上static class Person{ static int i; //静态成员变量 ...
- EMVTag系列1《数据分组》
数据分组的设计在个人化过程中承担着重要的作用.数据分组标识符(DGI)是两字节十六进制数.数据分组标识的第一个字节等于'01'到'1E',表明数据存储的SFI.第二个字节表明SFI记录的记录编号.其他 ...
- KnockoutJS学习笔记10:KonckoutJS foreach绑定
KnockoutJS foreach绑定用来处理数组,通常用来将一个数组绑定到一个列表或者table中.在foreach绑定中,我们可以使用if.with等嵌套绑定. 示例代码: <tabl ...
- 获得N位数字字母随机组合
import string import random def get_rand(n): allw = string.letters+string.digits r = [] for i in ran ...