excel批量提取网页标题
最近时间比较忙,有时候很多网页需要临时保存,以便空闲的时候查看。单纯的保存网页链接会让人很枯燥,所以需要自动批量提取标题。
为了这个小功能去写个小程序有点不划算,所以就利用excel实现了这个功能。
先上图:

代码如下:
Option Explicit Public Function GetTitle(url As String)
Dim xmlHttp As Object
Dim strHtml As String url = Trim(url) If LCase(Left(url, )) = "https" Then GetTitle = "暂不支持https协议"
Exit Function
End If '都不能构成完整的http协议,起码也得 a.cc
If Len(url) < Then
Exit Function
End If url = "http://" & Replace(Trim(url), "http://", "") Set xmlHttp = CreateObject("Microsoft.XMLHTTP")
xmlHttp.Open "GET", url, True
xmlHttp.send (Null)
While xmlHttp.ReadyState <>
DoEvents
Wend
strHtml = LCase(BytesToBstr(xmlHttp.responseBody))
GetTitle = Split(Split(strHtml, "<title>")(), "</title>")()
Set xmlHttp = Nothing
End Function Private Function BytesToBstr(Bytes)
Dim Unicode As String
If IsUTF8(Bytes) Then '如果不是UTF-8编码则按照GB2312来处理
Unicode = "UTF-8"
Else
Unicode = "GB2312"
End If Dim objstream As Object
Set objstream = CreateObject("ADODB.Stream")
With objstream
.Type =
.Mode =
.Open
.Write Bytes
.Position =
.Type =
.Charset = Unicode
BytesToBstr = .ReadText
.Close
End With
Set objstream = Nothing
End Function '判断网页编码函数
Private Function IsUTF8(Bytes) As Boolean
Dim i As Long, AscN As Long, Length As Long
Length = UBound(Bytes) + If Length < Then
IsUTF8 = False
Exit Function
ElseIf Bytes() = &HEF And Bytes() = &HBB And Bytes() = &HBF Then
IsUTF8 = True
Exit Function
End If Do While i <= Length -
If Bytes(i) < Then
i = i +
AscN = AscN +
ElseIf (Bytes(i) And &HE0) = &HC0 And (Bytes(i + ) And &HC0) = &H80 Then
i = i + ElseIf i + < Length Then
If (Bytes(i) And &HF0) = &HE0 And (Bytes(i + ) And &HC0) = &H80 And (Bytes(i + ) And &HC0) = &H80 Then
i = i +
Else
IsUTF8 = False
Exit Function
End If
Else
IsUTF8 = False
Exit Function
End If
Loop If AscN = Length Then
IsUTF8 = False
Else
IsUTF8 = True
End If End Function
【说明】:因为目前保存的网页都是文章类型,所以就直接避免处理https安全连接了。
相关知识点:excel批量提取网页标题,excel自动提取网页标题,vb自动识别网页编码,vb字符串utf8转gbk
excel批量提取网页标题的更多相关文章
- 使用Excel批量提取文件名
		Excel中如何快速选择所有奇数行或偶数行? 方法3:=MOD(ROW(),2) 总结:方法1和方法2的区别主要在ctrl键的使用 轻松将一个文件夹里所有的文件名提取出来,放到Excel表格里 &qu ... 
- 【Excel】获取网页标题的VBA
		在宏录制,完成后可以直接在网格上调用Title(网址).但好些会访问不了,原因不明. Function Title(ByVal url As String) As StringOn Error Res ... 
- 个人永久性免费-Excel催化剂功能第84波-批量提取OUTLOOK邮件附件
		批量操作的事情常常能让人感到十分畅快,区别于一次次的手工的操作,它真正实现了“人工智能”想要的效果,人指挥机器做事情,机器就可以按着人意去操作.此篇给大家再次送了批量操作一绝活,批量下载OUTLOOK ... 
- PDF文本内容批量提取到Excel
		QQ:231469242,版权所有 sklearn实战-乳腺癌细胞数据挖掘 https://study.163.com/course/introduction.htm?courseId=1005269 ... 
- Excel实用技巧-如何批量提取excel工作表名称
		Excel实用技巧-如何批量提取excel工作表名称 1. 打开Excel文件,点击“公式”栏,进而点击“定义管理器” 2. 在弹出的对话框中,点击新增按钮, 名称:“sheet”,引用位置:“=RE ... 
- 个人永久性免费-Excel催化剂功能第88波-批量提取pdf文件信息(图片、表格、文本等)
		日常办公场合中,除了常规的Excel.Word.PPT等文档外,还有一个不可忽略的文件格式是pdf格式,而对于想从pdf文件中获取信息时,常规方法将变得非常痛苦和麻烦.此篇给大家送一pdf文件提取信息 ... 
- 寻找与疾病相关的SNP位点——R语言从SNPedia批量提取搜索数据
		是单核苷酸多态性,人的基因是相似的,有些位点上存在差异,这种某个位点的核苷酸差异就做单核苷酸多态性,它影响着生物的性状,影响着对某些疾病的易感性.SNPedia是一个SNP调査百科,它引用各种已经发布 ... 
- Sqlite表结构读取工具,word批量转html,在线云剪贴板,文件批量提取工具;
		工欲善其事必先利其器,本周为您推荐工具排行 Sqlite表结构读取工具,word批量转html,在线云剪贴板,文件批量提取工具: 本周我们又要发干货了,准备好接受了吗? 为什么是干货,就是因为 ... 
- 订餐系统之Excel批量导入
		批量导入现在基本已经成为各类系统的标配了,当前,我们订餐系统也不例外,什么商家呀.商品呀.优惠码之类的,都少不了.毕竟嘛,对非开发人员来说,看到Excel肯定比看到很多管理系统还是要亲切很多的.这里, ... 
随机推荐
- mongodb.py
			from chatterbot.storage import StorageAdapter class Query(object): def __init__(self, query={}): sel ... 
- 【BZOJ3745】[Coci2015]Norma cdq分治
			[BZOJ3745][Coci2015]Norma Description Input 第1行,一个整数N: 第2~n+1行,每行一个整数表示序列a. Output 输出答案对10^9取模后的结果. ... 
- 九度OJ 1174:查找第K小数 (排序、查找)
			时间限制:1 秒 内存限制:32 兆 特殊判题:否 提交:6376 解决:2539 题目描述: 查找一个数组的第K小的数,注意同样大小算一样大. 如 2 1 3 4 5 2 第三小数为3. 输入: ... 
- 九度OJ 1040:Prime Number(质数) (递归)
			时间限制:1 秒 内存限制:32 兆 特殊判题:否 提交:5278 解决:2180 题目描述: Output the k-th prime number. 输入: k≤10000 输出: The k- ... 
- slide.js
			define(['jquery'], function (jquery) { function buildSmooth(config, motivateCallBack) { var timer = ... 
- Grunt 学习笔记【1】----基础知识
			题记:虽然现在大家都在推Webpack,无奈业务需要,因此研究下Grunt. 说明:本文是基于Grunt 0.4.5版本. 一 说明 为何要用构建工具? 一句话:自动化.对于需要反复重复的任务,例如压 ... 
- spring-data-redis RedisTemplate操作
			使用RedisTemplate来对对象.String等做缓存处理 首先定义一个对象并重写toString方法 public class UserInfo implements Serializable ... 
- vuex原理笔记
			本文总结自: https://tech.meituan.com/vuex-code-analysis.html, 将要点提炼为笔记,以便不时之需,安不忘危. 核心可分为两部分: 1.vue.use(V ... 
- 项目发布之后 总提示有一个.DLL找不到或不匹配
			最近发布项目(.net,winform)总提示有一个.dll文件找不到或者不匹配 但是在本地调试是正常的 这个.dll,原来是从.net组件中引用到项目的,后来我将此.dll文件从网上下载,然后在项目 ... 
- Spring Boot2.0之web开发
			1.关于静态资源的访问 在我们开发Web应用的时候,需要引用大量的js.css.图片等静态资源. Spring Boot默认提供静态资源目录位置需置于classpath下,目录名需符合如下规则: /s ... 
