php 读取网页源码 , 导出成txt文件, 读取xls,读取文件夹下的所有文件的文件名
<?php
// 读取网页源码
$curl = curl_init();
curl_setopt($curl, CURLOPT_URL, $url);
curl_setopt($curl, CURLOPT_HEADER, 1);
curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);//这个是重点。
$contents = curl_exec($curl);
//导出成txt文件
$str = "abcd";
$fp=fopen("pic.txt","w");
fputs($fp,$str);
fclose($fp);
//读取表格
require_once 'excel_reader2.php';
$data = new Spreadsheet_Excel_Reader();
$data->setOutputEncoding('UTF-8');
$data->read($filename);
for($i=1;$i<=$data->sheets[0]["numRows"];$i++){
for($j=1;$j<=$data->sheets[0]['numCols'];$j++){
$str2=@$data->sheets[0]['cells'][$i][$j];
}
}
//读取文件夹下的所有文件的文件名
$filedir = "C:/Users/xia/Desktop/新建文件夹/ProductInfoList/";
$rfdir= new rdfile($filedir);
$file = implode("\r\n",$rfdir->fileList);
class rdfile{
public $fileList; // 所有子文件夹的文件名
public $ftype; // 限制文件的类型
public $dirlist; // 当前文件夹下的所有文件和文件夹名称。
function __construct($path,$filetype="*"){
if(!is_dir($path)){die("这不是个目录");}
$len = strlen($path)-1;
if($path{$len} == "/"||$path{$len} == "\\"){$path = substr($path,0,-1);}
$this->ftype = $filetype;
$this->fileList = array();
$this->readypath($path);
}
public function readypath($path){
$dirList = scandir($path);
unset($dirList[0]);
unset($dirList[1]);
$this->dirlist = $dirList;
foreach($dirList as $key=>$value){
$pathfile=$path. DIRECTORY_SEPARATOR .$value;
if(is_dir($pathfile)){
$this->readypath($pathfile);
}else if(is_file($pathfile)){
if($this->ftype=="*"){
$this->fileList[] = $pathfile;
}else{
if(strrchr($pathfile,".") == ".".$this->ftype){$this->fileList[] = $pathfile;}
}
}
}
}
}
?>
php 读取网页源码 , 导出成txt文件, 读取xls,读取文件夹下的所有文件的文件名的更多相关文章
- C#读取网页源码
#region 1.读取 网页源码 + static string ReadHtml(string urlStr,int type) /// <summary> /// 读取 网页源码 + ...
- C语言之socket获取网页源码
写爬虫也许你用的是python,类似urlopen(url).read()即可获得普通的网页的源码,或者用的java的网络库加上流操作,或者其他高级语言.但你有没有想过使用C语言来实现呢?我曾经以为用 ...
- delphi : 取得网页源码内容
取得网页的源码内容的函数以及调用方法供大家参考: program geturl; uses wininet, windows; //取网页内容 function StrPas(const Str: P ...
- Python3.x获取网页源码
Python3.x获取网页源码 1,获取网页的头部信息以确定网页的编码方式: import urllib.request res = urllib.request.urlopen('http://ww ...
- htmlunit抓取js执行后的网页源码
上次我不是写了一个自动抓取博客访问量吗 (点击打开链接) 可是昨天晚上我又运行的时候,发现不能用了.. 运行了几次 发现使用URLConnection 得到的网页源码和浏览器直接查看的不同. URLC ...
- Python3 Selenium WebDriver网页的前进、后退、刷新、最大化、获取窗口位置、设置窗口大小、获取页面title、获取网页源码、获取Url等基本操作
Python3 Selenium WebDriver网页的前进.后退.刷新.最大化.获取窗口位置.设置窗口大小.获取页面title.获取网页源码.获取Url等基本操作 通过selenium webdr ...
- Python3.4 获取百度网页源码并保存在本地文件中
最近学习python 版本 3.4 抓取网页源码并且保存在本地文件中 import urllib.request url='http://www.baidu.com' #上面的url一定要写明确,如果 ...
- Selenium WebDriver-网页的前进、后退、刷新、最大化、获取窗口位置、设置窗口大小、获取页面title、获取网页源码、获取Url等基本操作
通过selenium webdriver操作网页前进.后退.刷新.最大化.获取窗口位置.设置窗口大小.获取页面title.获取网页源码.获取Url等基本操作 from selenium import ...
- Android 网络图片查看器与网页源码查看器
在AndroidManifest.xml里面先添加访问网络的权限: <uses-permission android:name="android.permission.INTERNET ...
随机推荐
- MySQL 语句使用到的关键字 函数 记录
一 处理重复数据 1 使用 UNIQUE 唯一键 (添加数据) 创建表的时候设置 2 使用 DISTINCT (查询数据--过滤) eg:SELECT DISTINCT `name` from ...
- 前台jquery+ajax+json传值,后台处理完后返回json字符串,如何取里面的属性值?(不用springmvc注解)
一.取属性值 前台页面: function select(id){ alert("hfdfhdfh"+id); $.ajax({ url:"selectByid.jsp& ...
- 搭建IONIC开发环境
1.准备工作 下载 Node.js(下载包),WebStorm(IDE,编写代码,浏览器调试),JDK(webstorm 运行环境),Android SDK (Android编译) 2.配 ...
- django中css问题
django中加载的css,js,图片其中js和图片可以加载出来,而css没有效果.原因如下: 这是因为你安装的某些IDE 或者其他更改了注册表导致的系统的注册表\HKEY_CLASSES_ROOT\ ...
- Python’s SQLAlchemy vs Other ORMs[转发 7] 比较结论
Comparison Between Python ORMs For each Python ORM presented in this article, we are going to list t ...
- Javascript学习笔记2.1 Javascript与DOM简介
DOM(文档对象模型)简介 DOM(文档对象模型)针对HTML和XML文档的一个API. DOM可以将任何HTML或XML文档描绘成由多层节点构成的树形结构,它是中立于平台和语言的接口,允许程序和脚本 ...
- Android开发--TableLayout的应用
1.简介 TableLayout为表格框架结构
- flex 添加svn插件
http://blog.csdn.net/gangan1345/article/details/7926848
- 关于RSA加密算法的长度限制问题
RSA是常用的非对称加密算法.近来有学生在项目中使用System.Security类库中的RSA加密算法时,出现了“不正确的长度”,这实际上是因为待加密的数据超长所致..net Framework中提 ...
- ionic实现上拉到底内容提示
<!--html代码--> <ion-content has-bouncing = true on-drag-up="scrollDragUp()"> &l ...