php 提取网页图片地址正则

2024-11-10

php用正则匹配出图片img标签中的src路径（兼容）

用php抓图片是个常用的需求,下面提供一个比较兼容的正则表达式来实现php抓取出页面.字符串中所有图片的src. 下面是一个范例,能匹配各种标签格式写法的图片,不管src在什么地方,还是单引号.双引号.没引号,都能匹配出来. 范例源码参考: <?php header("Content-type:text/html;charset=utf-8"); $str = '<img class="home-thumb" src="http://www.d

C#正则表达式通过HTML提取网页中的图片src

目前在做HoverTreeCMS项目中有处理图片的部分,参考了一下网上案例,自己写了一个获取内容中的图片地址的方法. 可以先看看效果:http://tool.hovertree.com/a/zz/img/ 一般来说一个 HTML 文档有很多标签,比如“<html>”.“<body>”.“<table>”等,想把文档中的 img 标签提取出来并不是一件容易的事.由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易.于是想要寻找它们就必须写一个非常健全的正则表达式

ios 提取html 字符串中的img 的地址（图片地址）

本文原文地址 http://www.cnblogs.com/qianLL/p/6082287.html 有时候后台返回的是一串html'字符串我们需要把里面的图片地址提取出来这个关键就是一个正确的正则表达式即 <(img|IMG)(.*?)(/>|></img>|>) 具体代码如下返回的是这串字符串里面所有的图片地址所有是一个集合 + (NSArray *)filterImage:(NSString *)html { NSMutableArray *re

C#正则提取html图片等

去除html标记,比较实用,分享给大家. /// <summary> /// 去除HTML标记 /// </summary> /// <param name="Htmlstring">包括HTML的源码 </param> /// <returns>已经去除后的文字</returns> public static string NoHTML(string

asp自动解析网页中的图片地址，并将其保存到本地服务器

程序实现功能:自动将远程页面的文件中的图片下载到本地. 程序代码 <% '将本文保存为 save2local.asp '测试:save2local.asp?url=http://ent.sina.com.cn/s/m/2003-11-11/1411231388.html '本文根据 chinahuman 的<用asp自动解析网页中的图片地址,并将其保存到本地服务器>改编和优化 '自动创建目录,自动将原文件名更名,文件格式的限制以及其他功能的一些优化 '自动保存网页文件中 http://.

Js正则表达式提取图片地址

JavaScript使用正则表达式和Replace两种方法提取IMG标签图片地址,代码如下: /正则表达式 <script language="javascript"> var a='<P><IMG src="http://bbs.cn.yimg.com/user_img/200701/31/jisuanji986_117025184198149.jpg" mce_src="http://bbs.cn.yimg.com/use

c# HTML中提取图片地址

public class HtmlHelper { /// <summary> /// HTML中提取图片地址 /// </summary> public static List<string> PickupImgUrl(string html) { Regex regImg = new Regex(@"<img\b[^<>]*?\bsrc[\s

正则匹配获取HTML图片地址，正则匹配获取HTML内容

//正则匹配获取HTML图片地址preg_match_all('/<img.*?src="(.*?)".*?>/is', $str, $array); if (isset($array[1])) { foreach ($array[1] as $kk => $kv) { $str = str_replace($kv, str_replace(' ', '', $kv), $str); } } $data = array();//正则匹配获取HTML内容 preg_ma

网页图片提取助手(支持背景图、选择dom范围)

网页图片提取助手(支持背景图.选择dom范围) 网页图片下载工具.网页图片批量保存. 使用场景: 作为web前端开发首——学习小生的你我,仿学在线页面是常有的事,但是一些在线资源,比如图片,图片有img标签中的图片,有背景图,当然还有一些旧浏览器不支持的webp,仿个页面需要 ctrl+m . ctrl+s .查看element.css ...以查找和保存所需图片. ——仿个页面我容易么我? 现在有这个小工具,希望可以助你一点点绵力. 主要应用于以下功能: 一.按需保存所选节点的所有图片可以选

PHP提取字符串中的图片地址

PHP提取字符串中的图片地址 $str='<p><img border="0" src="upfiles/2009/07/1246430143_1.jpg" alt=""/></p>'; $pattern="/<[img|IMG].*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/"; preg_match

网页图片失效自动替换图片地址js代码

当你网页中的图片失效之后它会显示你预先设定好的默认图片,而不是显示为一个大大的红叉叉. js脚本如下: <script language="javascript"> var noimg=document.getElementsByTagName("img"); for(i=0; i < noimg.length; i++){ noimg[i].onerror=function(){this.src="默认转换的图片地址"} }

正则获取html标签字符串中图片地址

html标签字符串: var htmlStr = "<div class='testClass'><img=http://www.chinanews.com/part/home2013/451/U610P4T451D5F17247DT20190218112223.jpg></div>"; 需求:使用正则获取img图片地址 1.使用正则后向引用提示 * 为invalid quantifier,需要添加上代表任意字符的 . var htmlStr

通过scrapy内置的ImagePipeline下载图片到本地、并提取本地保存地址

1.通过scrapy内置的ImagePipeline下载图片到本地 2.获取图片保存本地的地址 1.通过scrapy内置的ImagePipeline下载图片到本地 1)在settings.py中打开 ITEM_PIPELINES 的注释,在 ITEM_PIPELINES 中加入 ITEM_PIPELINES = { 'spider_first.pipelines.SpiderFirstPipeline': 300, 'scrapy.pipelines.images.ImagesPipeline

[Python爬虫]煎蛋网OOXX妹子图爬虫（1）——解密图片地址

之前在鱼C论坛的时候,看到很多人都在用Python写爬虫爬煎蛋网的妹子图,当时我也写过,爬了很多的妹子图片.后来煎蛋网把妹子图的网页改进了,对图片的地址进行了加密,所以论坛里面的人经常有人问怎么请求的页面没有链接.这篇文章就来说一下煎蛋网OOXX妹子图的链接获取方式. 首先说明一下,之前煎蛋网之所以增加了反爬虫机制,应该就是因为有太多的人去爬他们的网站了.爬虫频繁的访问网站会给网站带来压力,所以,建议大家写爬虫简单的运行成功就适可而止,不要过分地去爬别人的东西. 爬虫思路分析图片下载流程图首

JAVA多线程超时加载当网页图片

先上图: 这一次没有采取正则匹配,而采取了最简单的java分割和替代方法进行筛选图片它能够筛选如下的图片并保存到指定的文件夹如: “http://xxxx/xxxx/xxx.jpg” 'http://xxxx/xxxx/xxx.jpg' 如果中间的分隔符为\/而不是/,可进行替换如将http:\/\/xxxxx\/xxx\/xxx.jpg替换为http://xxxxx/xxx/xxx.jpg import java.io.File; import java.io.FileOutputStr

文件处理工具 gif合成工具文件后缀批量添加工具文件夹搜索工具重复文件查找工具网页图片解析下载工具等

以下都是一些简单的免费分享的工具,技术支持群:592132877,提供定制化服务开发. Gif动图合成工具主要功能是扫描指定的文件夹里的所有zip文件,然后提取Zip文件中的图片,并合成一张gif图片,存储到新的路径下,支持设置gif的时间,演示效果如下: 下载地址:gif合成工具文件批量移动工具主要功能是将指定文件夹及子文件夹里所有文件,复制到新的文件夹下,可以指定是否删除源文件.以下动图演示效果. 下载地址:文件批量移动工具.exe 文件批量移动工具主要功能是将指定目录下所有文件按照

java简单web爬虫(网页图片)

java简单web爬虫(网页图片)效果,执行main()方法后图片就下载道C盘的res文件夹中.没有的话创建一个文件夹代码里的常量根据自己的需求修改,代码附到下面. package com.sinitek.sirm.common.utils; import java.io.*; import java.net.URL; import java.net.URLConnection; import java.util.*; import java.util.regex.Matcher; import

java爬虫-简单爬取网页图片

刚刚接触到“爬虫”这个词的时候是在大一,那时候什么都不明白,但知道了百度.谷歌他们的搜索引擎就是个爬虫. 现在大二.再次燃起对爬虫的热爱,查阅资料,知道常用java.python语言编程,这次我选择了java.在网上查找的代码在本地跑大部分都不能使用,查找相关的资料教程也没有适合的.实在头疼... 现在自己写了一个简单爬取网页图片的代码,先分析一下自己写的代码吧 //获得html文本内容 String HTML = cm.getHtml(URL); //获取图片标签 List<String>

C#正则表达式匹配HTML中的图片路径，图片地址

C#正则表达式匹配HTML中的图片路径,图片地址最近的项目中有个关于网页取图的功能需要我自己开发,那就是用正则表达式来匹配图片标签. 一般来说一个 HTML 文档有很多标签,比如“<html>”.“<body>”.“<table>”等,想把文档中的 img 标签提取出来并不是一件容易的事.由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易.于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 img 标

Python爬虫网页图片

一概述参考http://www.cnblogs.com/abelsu/p/4540711.html 弄了个Python捉取单一网页的图片,但是Python已经升到3+版本了.参考的已经失效,基本用不上.修改了下,重新实现网页图片捉取. 二代码 #coding=utf-8 #urllib模块提供了读取Web页面数据的接口 import urllib #re模块主要包含了正则表达式 import re import urllib.parse import urllib.request #定义一

HTML静态网页图片热点、框架、表单

图片热点: 规划出图片上的一个区域,可以做出超链接,直接点击图片区域就可以完成跳转的效果. 示例: 网页划区: 在一个网页里,规划出一个区域用来展示另一个网页的内容. 示例: 框架: 1.frameset frameset最外层,使用时需要去除body改用frameset. <frameset rows="100,*" frameborder="no">--上下分,第一行100像素,剩余为第二行,rows换成cols,则变为左右分.frameborde

php 提取网页图片地址正则

热门专题