php 获得汇率（解析页面内容获得指定数据）

首先贴出原文链接：https://jingyan.baidu.com/article/922554465bf115851748f45f.html

方法如下：

function getRate($from, $to, $amount){

  $data = file_get_contents("http://www.baidu.com/s?wd={$from}%20{$to}&rsv_spt={$amount}");preg_match("/<div>1\D*=(\d*\.\d*)\D*<\/div>/",$data, $converted);

  $converted = preg_replace("/[^0-9.]/", "", $converted[1]);

  return number_format(round($converted, 3), 3);

}

刚开始我还真以为是百度给的汇率接口，结果我把$data直接打印出来才发现这是抓取的页面内容，不过确实能用，感觉这种方式很多东西都可以获取到了，但是不知道会有什么风险。

如果想获得更为准确和及时的汇率信息，当然只能去中国银行的官网去获得了。http://www.boc.cn/sourcedb/whpj/

（不知道是否有实时的免费的汇率接口，反正我这里没有找到，如果有哪位读者找到了，麻烦分享一下）

此处以获得欧元汇率为例：

1.我们先去分析一下页面的接口（右键->查看源代码）得到该页面的代码。

因为我们打开网页的时候并不是我们想要的内容，通常搜索结果都会是异步获取的，我们需要找到它异步获取数据的方式

由此我们可以看出，由此我们可以得到他的搜索结果的获取地址：http://srh.bankofchina.com/search/whpj/search.jsp?erectDate=2017-11-13&nothing=2017-11-13&pjname=1326&page=1

那么我们就可以传递对应参数拉取到对应页面

$pageCode = file_get_contents("http://srh.bankofchina.com/search/whpj/search.jsp?erectDate=2017-11-13&nothing=2017-11-13&pjname=1326&page=1");

2.截取我们需要的内容这里就稍微得用到正则表达式了。

分析一下我们需要的数据是个什么结构

这是原始的源代码，，我将其空格换行制表符等全部删掉，然后开始匹配（由于我技术有限所已并不能一次性很完美的解析出内容一下是我粗暴的做法）

$data = str_replace(array(" ","\r","\n","\t"), "",$pageCode);
preg_match('/<tr>[\s]*<td>欧元<\/td>[\s]*<td>[\s|\S]*<\/td>[\s]*<\/tr>/',$data, $converted);//这里其实可以一次性匹配解析出想要的数据，只是需要好好熟悉一下正则，
$data = str_replace("</tr><tr>", ";", $converted[0]);
$data = str_replace(array("<tr>","</tr>"), "", $data);
$data = str_replace("</td><td>", ",", $data);
$data = str_replace(array("<td>","</td>"), "", $data);
$rateList = explode(";", $data);
$rate = explode(",", $rateList[0]);

整理为方法如下：

function getEurRate(){

  $date = date("Y-m-d", time());
//获得页面代码

  $data = file_get_contents("http://srh.bankofchina.com/search/whpj/search.jsp?erectDate=".$date."&nothing=".$date."&pjname=1326&page=1");
//去掉非字符

  $data = str_replace(array(" ","\r","\n","\t"), "", $data);
//得到汇率代码

  preg_match('/<tr>[\s]*<td>欧元<\/td>[\s]*<td>[\s|\S]*<\/td>[\s]*<\/tr>/',$data, $converted);
//开始各种调整格式 为了整理为 数组

  $data = str_replace("</tr><tr>", ";", $converted[0]);

  $data = str_replace(array("<tr>","</tr>"), "", $data);

  $data = str_replace("</td><td>", ",", $data);

  $data = str_replace(array("<td>","</td>"), "", $data);

  $rateList = explode(";", $data);

  $rate = explode(",", $rateList[0]);

  //$rate [0] 国家 [1] 现汇买入价 [2]现钞买入价[3]现汇卖出价[4]现钞卖出价[5]外管局中间价[6]中行折算价

  $rate = $rate[3];

  $rate = round(($rate/100),2);

  if(is_numeric($rate))return $rate;

  else return false;

}

简单粗暴，但是有效。有很多可优化的地方我就不多描述了。

php 获得汇率（解析页面内容获得指定数据）的更多相关文章

Scrapy框架——介绍、安装、命令行创建，启动、项目目录结构介绍、Spiders文件夹详解（包括去重规则）、Selectors解析页面、Items、pipelines（自定义pipeline）、下载中间件（Downloader Middleware）、爬虫中间件、信号
一介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速.简单.可扩展的方式从网站中提取所需的数据.但目前Scrapy的用途十分广泛,可 ...
PHP curl获取页面内容，不直接输出到页面，CURLOPT_RETURNTRANSFER参数设置
使用PHP curl获取页面内容或提交数据,有时候希望返回的内容作为变量储存,而不是直接输出.这个时候就必需设置curl的或true. 1.curl获取页面内容, 直接输出例子: <?php $ ...
PHP CURL获取页面内容输出例子
使用PHP curl获取页面内容或提交数据,有时候希望返回的内容作为变量储存,而不是直接输出.这个时候就必需设置curl的CURLOPT_RETURNTRANSFER选项为1或true. 1.curl ...
asp.net将页面内容按需导入Excel，并设置excel样式，下载文件(解决打开格式与扩展名指定的格式不统一的问题)
//请求一个excel类 Microsoft.Office.Interop.Excel.ApplicationClass excel = null; //创建 Workbook对象 Microsoft ...
[实战演练]python3使用requests模块爬取页面内容
本文摘要: 1.安装pip 2.安装requests模块 3.安装beautifulsoup4 4.requests模块浅析 + 发送请求 + 传递URL参数 + 响应内容 + 获取网页编码 + 获取 ...
LIMS系统仪器数据采集-使用xpdf解析pdf内容
不同语言解析PDF内容都有各自的库,比如Java的pdfbox,.net的itextsharp. c#解析PDF文本,关键代码可参考: http://www.cnblogs.com/mahongbia ...
python爬虫解析页面数据的三种方式
re模块 re.S表示匹配单行 re.M表示匹配多行使用re模块提取图片url,下载所有糗事百科中的图片普通版 import requests import re import os if not ...
htmlunit爬虫工具使用--模拟浏览器发送请求，获取JS动态生成的页面内容
Htmlunit是一款模拟浏览抓取页面内容的java框架,具有js解析引擎(rhino),可以解析页面的js脚本,得到完整的页面内容,特殊适合于这种非完整页面的站点抓取. 下载地址: https:// ...
nodejs cheerio模块提取html页面内容
nodejs cheerio模块提取html页面内容 1. nodejs cheerio模块提取html页面内容 1.1. 找到目标元素 1.2. 美化文本输出 1.3. 提取答案文本 1.4. 最终 ...

随机推荐

GIT操纵
简易的命令行入门教程: Git 全局设置: git config --global user.name "XXX" git config --global user.email & ...
Unity3D获取系统当前时间，并格式化显示
Unity 获取系统当前时间,并格式化显示.通过“System.DateTime”获取系统当前的时间,然后通过格式化把获得的时间格式化显示出来,具体如下: 1.打开Unity,新建一个空工程,Unit ...
20175317 《Java程序设计》第三周学习总结
20175317 <Java程序设计>第三周学习总结教材学习内容总结第三周我学习了教材第四章的内容,了解了Java中的部分常用语句,学到了以下内容: 明白了什么是类,成员变量有哪些,什 ...
C++中数组声名后不初始化，数组里的值都是0吗？
这得看数组的申明情况: 1.全局/静态数组如果申明的是全局/静态数组,系统会把数组的内容自动初始化为0. 2.局部数组如果申明的是局部数组,数组的内容会是随机的,不一定是0.如函数内声明: int ...
Bootstrap框架整理
bootstrap框架的介绍栅格系统 bootstrap框架把整个浏览器的宽度分为12列,并能适配各种屏幕的尺寸大小进行相应的匹配,达到调节页面大小的效果. 首先需要放置一个容器div,class= ...
element-ui <el-input> +<el-tree>使用
<template> <!-- 需求:通过点击<el-input> 将<el-tree>树型结构打开,选中<el-tree>某个值显示在<e ...
Linux下输入某些命令时会提示：bash:command not found
首先,查看$PATH中是否包含了这些命令. $PATH:决定了shell到哪些目录中去寻找命令或程序,PATH值是一系列的目录.当运行程序时,linux到这些目录下搜索进行编译链接. 格式: PATH ...
5、Angular的一些其他核心特性，学习的主要模块
Angular应用程序的八个主要构造块: 模块组件模板元数据数据绑定指令服务依赖注入其他重要的Angular特性和服务: 动画表单 HTTP 组件生命周期管道过滤器路由测试
linux 基础测试题
1. 什么是buffer和cache buffer (cpu→内存→磁盘,简称为写缓冲 ):当你网上观看视频且网络波动较大的时候,会发现弹出一个正在缓冲中,这个就是buffer. cache(磁盘→内 ...
python中如何删除列表中的所有元素
今天写代码的时候遇到一个小问题,Python中要删除列表中的所有元素.Python本身就提供了pop.remove.del这些删除的函数.我想着用循环实现,结果很麻烦.几番周折上了stackoverf ...

php 获得汇率（解析页面内容获得指定数据）

php 获得汇率（解析页面内容获得指定数据）的更多相关文章

随机推荐

热门专题