//转载:http://www.r-china.net/forum.php?mod=viewthread&tid=881&extra=page%3D1
//用R抓取人民日报网数据 library(RCurl) for (i in :) {
base <- "http://vip.stock.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/603000.phtml?year=2013&jidu="
jidu <- i
url <- paste(base,jidu,sep='') temp <- getURL(url)
k=strsplit(temp,"\r\n")[[]] #以list形式展现,方便以下操作 #抓取日期
timeadr <- k[grep("<a target='_blank'",k)+] #第1行 日期
time=substring(timeadr,,)
print(unlist(strsplit(time," "))) #抓取 开盘价,最高价,收盘价,最低价
for(j in :) #一个季度源代码中第3到6行
{ xxx <- k[grep("<a target='_blank'",k)+j] # 所需信息
xx <- gregexpr(">\\d+",xxx) #找出指定元素在本行第几位 for(m in :length(xxx))
{
yy=xx[[m]]
xxs=substring(xxx[m],yy+,yy+attr(yy,'match.length')+) #:6行+
print(xxs) #每次循环都输出该值
} } #抓取交易量
xxx=k[grep("<a target='_blank'",k)+] #抓取路径下第7行 交易量
xx=gregexpr(">\\d+",xxx) #找出指定元素在本行第几位
for(n in :length(xxx))
{
yy=xx[[n]]
xxs=substring(xxx[n],yy+,yy+attr(yy,'match.length')-) #:6行+ 7行- 8行-
print(xxs) #每次循环都输出该值
}
#抓取交易金额
xxx=k[grep("<a target='_blank'",k)+] #抓取路径下第8行 交易金额
xx=gregexpr(">\\d+",xxx) #找出指定元素在本行第几位
for(o in :length(xxx))
{
yy=xx[[o]]
xxs=substring(xxx[o],yy+,yy+attr(yy,'match.length')-) #:6行+ 7行- 8行-
print(xxs) #每次循环都输出该值
} }

需要的基础有:RCurl包及其函数,R字符处理,正则表达式

刚入门,学习中。。。

R 实例1的更多相关文章

  1. R语言高性能编程(三)

    一.使用并行计算加倍提升性能1.数据并行 VS 任务并行实现数据并行的算法scoket 并行性注意并行计算时间并不与执行任务的计算资源数目成正比(计算机核心),amdahl定律:并行代码的速度受限于串 ...

  2. 方差分析 | ANOVA | 原理 | R代码 | 进阶 | one way and two way

    原理 比较两组就用t-test,比较三组及以上就用ANOVA.注意:我们默认说的都是one way ANOVA,也就是对group的分类标准只有一个,比如case和control(ABCD多组),tw ...

  3. 让R与Python共舞

    转载:http://ices01.sinaapp.com/?p=129      R(又称R语言)是一款开源的跨平台的数值统计和数值图形化展现 工具.通俗点说,R是用来做统计和画图的.R拥有自己的脚本 ...

  4. 《R实战》读书笔记二

    第一章 R简单介绍 本章概要 1安装R 2理解R语言 3执行R程序 本章所介绍的内容概括例如以下. 一个典型的数据分析步骤如图1所看到的. 图1:典型数据分析步骤 简而言之,现今的数据分析要求我们从多 ...

  5. 快速入门:Python简单实例100个(入门完整版)

    Python3 100例 文章目录 Python3 100例 实例001:数字组合 实例002:“个税计算” 实例003:完全平方数 实例004:这天第几天 实例005:三数排序 实例006:斐波那契 ...

  6. Python调用R编程——rpy2

    在Python调用R,最常见的方式是使用rpy2模块. 简介 模块 The package is made of several sub-packages or modules: rpy2.rinte ...

  7. python100实例

    实例001:数字组合 题目 有四个数字:1.2.3.4,能组成多少个互不相同且无重复数字的三位数?各是多少? 程序分析 遍历全部可能,把有重复的剃掉. total=0 for i in range(1 ...

  8. c/c++: c++继承 内存分布 虚表 虚指针 (转)

    http://www.cnblogs.com/DylanWind/archive/2009/01/12/1373919.html 前部分原创,转载请注明出处,谢谢! class Base  {  pu ...

  9. c++继承中的内存布局

    今天在网上看到了一篇写得非常好的文章,是有关c++类继承内存布局的.看了之后获益良多,现在转在我自己的博客里面,作为以后复习之用. ——谈VC++对象模型(美)简.格雷程化    译 译者前言 一个C ...

随机推荐

  1. div+css+jQuery图片横向滚动代码(带左右点击按钮)

    首先感谢Blue老师的javascript教程,给了我很多的启发,这是我在看完10 - 定时器的使用 - 2这节视频后,自己试着用jQuery重新改写了一下代码,感觉至少比百度搜出来的那一坨靠谱多了, ...

  2. jquery中each()函数

    今天在使用each函数时,发现写的js代码明明木有问题,为什么点击没有执行呢.js始终处于入门阶段,只好瞎鼓捣. 弄了半天,总算可以了.代码如下: <script type="text ...

  3. spring(spring boot)笔记

    1.查看数据库连接:org.springframework.boot.autoconfigure.jdbc里的public DataSource dataSource() 方法.在这里打断点,可以查看 ...

  4. 通过API函数来控制SQLite数据库增删改查

    person类属性有Intenger id,String name,Intenger  age,相应的构造方法和set get方法. package com.xh.tx.dao; import and ...

  5. FileOutputSream

    package cd.itcast.fileinputstream; import java.io.File; import java.io.FileNotFoundException; import ...

  6. MYSQL数据库表中字段追加字符串内容

    $sql="update parts set p_notes=concat(p_notes,'{$p_notes}') where p_id={$p_id}"; parts为表名 ...

  7. equals方法,hashcode()方法

    Object类的equals 方法 用来检测两个对象是否相等,即两个对象的内容是否相等,区分大小写.   (一)说到equals方法,不得不提一下==号. ==用于比较引用和比较原生数据类型时具有不同 ...

  8. hdu 1029

    #include"stdio.h" int main(void) { int n,x,y,t,i; while(scanf("%d",&n)!=EOF) ...

  9. EXCLE中快速插入图片

    在excle中怎么快速插入图片呢,一张一张点实在比较麻烦 解决办法: <table><img src="D:\A.png" width="60" ...

  10. hdu 4255 A Famous Grid

    题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=4255 A Famous Grid Description Mr. B has recently dis ...