PHP下载/采集远程图片到本地
/**
* 下载远程图片到本地
*
* @param string $url 远程文件地址
* @param string $filenNme 保存后的文件名(为空时则为随机生成的文件名,否则为原文件名)
* @param array $fileType 允许的文件类型
* @param string $dirName 文件保存的路径(路径其余部分根据时间系统自动生成)
* @param int $type 远程获取文件的方式
* @return json 返回文件名、文件的保存路径
* @author 52php.cnblogs.com
*/
function download_image($url, $fileName = '', $dirName, $fileType = array('jpg', 'gif', 'png'), $type = 1)
{
if ($url == '')
{
return false;
} // 获取文件原文件名
$defaultFileName = basename($url); // 获取文件类型
$suffix = substr(strrchr($url, '.'), 1);
if (!in_array($suffix, $fileType))
{
return false;
} // 设置保存后的文件名
$fileName = $fileName == '' ? time() . rand(0, 9) . '.' . $suffix : $defaultFileName; // 获取远程文件资源
if ($type)
{
$ch = curl_init();
$timeout = 30;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file = curl_exec($ch);
curl_close($ch);
}
else
{
ob_start();
readfile($url);
$file = ob_get_contents();
ob_end_clean();
} // 设置文件保存路径
//$dirName = $dirName . '/' . date('Y', time()) . '/' . date('m', time()) . '/' . date('d', time());
$dirName = $dirName . '/' . date('Ym', time());
if (!file_exists($dirName))
{
mkdir($dirName, 0777, true);
} // 保存文件
$res = fopen($dirName . '/' . $fileName, 'a');
fwrite($res, $file);
fclose($res); return array(
'fileName' => $fileName,
'saveDir' => $dirName
);
}
实战经历:
博客中有些图片是直接引用其他网站的,这些天不知道咋地,估计是对方做了防盗链操作,导致博客中的图片显示不出来,没办法,只好用PHP批量采集下来,并且批量替换博文中的图片地址:
/**
* 批量下载博客中的图片到本地
*/
public function index()
{
global $_G; $blogModel = model('Blog', 'blog');
$list = $blogModel->order('gid desc')->limit(10)->findPage(); $page = get_gpc('page') ? get_gpc('page') : 1;
$totalPages = $list['totalPages'];
$page = $page + 1; if ($page > $totalPages)
{
die('更新完毕!');
} foreach ($list['data'] as $val)
{
$content = $val['content'];
$excerpt = $val['excerpt']; $_G['isContentUpdate'] = $_G['isExcerptUpdate'] = false; /* 内容 */
$content = preg_replace_callback("/src=\"(http:\/\/images\.cnblogs\.com\/cnblogs_com[^\"]+)\"/", function($matches) { global $_G;
$_G['isContentUpdate'] = true; // 下载远程图片到本地
$res = download_image($matches[1], 'old', 'd:/PHP/xampp/htdocs/emlog/data/upload'); // 返回 下载后的图片url地址
return 'src="/data/upload/' . date('Ym', time()) . '/' . $res['fileName'] . '"'; }, $content); /* 摘要 */
$excerpt = preg_replace_callback("/src=\"(http:\/\/images\.cnblogs\.com\/cnblogs_com[^\"]+)\"/", function($matches) { global $_G;
$_G['isExcerptUpdate'] = true; // 下载远程图片d到本地
$res = download_image($matches[1], 'old', 'd:/PHP/xampp/htdocs/emlog/data/upload'); // 返回 下载后的图片url地址
return 'src="/data/upload/' . date('Ym', time()) . '/' . $res['fileName'] . '"'; }, $excerpt); /* 更新数据库 */
$where = array(
'gid' => $val['gid']
);
$data = array(); if ($_G['isContentUpdate'])
{
$data['content'] = $content;
} if ($_G['isExcerptUpdate'])
{
$data['excerpt'] = $excerpt;
} if ($data)
{
$blogModel->where($where)->save($data);
}
} /* 更新下一页 */
$url = url('blog/Main/index', array('page' => $page));
$msg = '正在更新' . $page . '/' . $totalPages;
redirect($url, 2, $msg);
}
PHP下载/采集远程图片到本地的更多相关文章
- [PHP学习教程 - 网络]001.下载/采集远程文件到本地(Download File)
引言:如何把http://mzitu.com里的图片全部下载下来呢? 一身浩然正气的AC陷入的深思.... 当然这里涉及到的功能有线程,网页请求,页面提取,下载图片等等.今天,我们先讲一下如何下载文件 ...
- php下载远程图片到本地
在使用 PHP 做简单的爬虫的时候,我们经常会遇到需要下载远程图片的需求,所以下面来简单实现这个需求1:使用curl 比如我们有下面这两张图片: $images = [ 'https://img.al ...
- curl获取远程图片存到本地
$url = 'http://sssss/sss/xu0fLo9waqKSTDO7j0kSO41O5Luq3LB6ozUvY4O7OsXUWNicB49fBs8nGYzoqcwGDARQZHpVuic ...
- thinkphp下载远程图片到本地
$url="http://www.test.com/test.jpg";//图片远程地址 $local="./Upload/test/test.jpg";//下 ...
- PHP通过url下载远程图片到本地
function GrabImage($url,$filename) { if($url==""):return false;endif; ob_start(); readfile ...
- PHP下载远程图片到本地的几种方法总结(tp5.1)
1.CURL 2.使用file_get_contents 3.使用fopen 参考链接:https://www.jb51.net/article/110615.htm
- php下保存远程图片到本地的函数
<?php header("content-type:text/html;charset=utf-8"); function GrabImage($url,$filename ...
- PHP抓取远程图片到本地保存(如何把错误信息用text文件写入)
最近在工作中需要开发了一个用户素材功能,里面需要将网上的各种图片素材进行本地化存储.于是在网上找了一些相关资料,并根据自身开发需要,整理了一下主要的逻辑代码. /** * PHP将网页上的图片攫取到本 ...
- php采集远程图片
随机推荐
- python基础——字典dict
1.概念: (1)字典dict,是一系列的键—值对.每个键key都和一个值value相映射.(字典是python中唯一的映射类型.) (2)每一项item,是一个键值对key—value对. (3)键 ...
- centos下vsftpd登录后无法看见文件,无法创建文件及文件夹
centos下vsftpd不能显示文件,不能创建文件及文件夹 这是由于selinux的机制 运行如下命令查看: [root@SZCLC6X-AMP-4393 www]# getsebool -a|gr ...
- JAVA并发-线程协作
这段时间有点忙,技术博客更新的比较少,今天更新一下相关并发的常用线程协作的类吧. ExecutorService 线程池,用于创造和复用线程,他有几种模式. 我举一个自定义线程池数量的例子如下 Exe ...
- springmvc中RedirectAttributes、SessionFlashMapManager的作用
RedirectAttributes 在重定向的时候可以传参,不能跨站传参,因为参数是保存在服务器端Session中SessionFlashMapManager 是RedirectAttributes ...
- [AtCoder ARC093F]Dark Horse
题目大意:有$2^n$个人,每相邻的两个人比赛一次.令两个人的编号为$a,b(a\leqslant b)$,若$a\neq 1$,则$a$的人获胜:否则若$b\in S$则$b$获胜,不然$1$获胜. ...
- 在浏览器中进行深度学习:TensorFlow.js (八)生成对抗网络 (GAN
Generative Adversarial Network 是深度学习中非常有趣的一种方法.GAN最早源自Ian Goodfellow的这篇论文.LeCun对GAN给出了极高的评价: “There ...
- ServletContext结合Servlet接口中的init()方法和destroy()方法的运用----网站计数器
我们一般知道Servlet接口中的init()方法在tomcat启动时调用,destroy()方法在tomcat关闭时调用.那么这两个方法到底在实际开发中有什么作用呢?这就是这个随笔主要讲的内容. 思 ...
- jdk,tomcat,mvn,android,php,linux等的初始化配置
jdk配置:系统变量->新建->变量名:JAVA_HOME 变量值:c:\jdk1.6.0_21(jdk安装目录:C:\Program Files (x86)\Java\jdk1.7.0_ ...
- 创建型设计模式之工厂模式(Abstract Factory)
结构 意图 提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类. 适用性 一个系统要独立于它的产品的创建.组合和表示时. 一个系统要由多个 ...
- SQL Server 及 Visual Studio的离线帮助文档
1>Sql Server帮助文档下载:地址 2>Visual Studion帮助文档下载:地址 3>安装Help Viewer 4>浏览到刚才下载的文件处进行安装 4>设 ...