最近玩爬虫,先把python解析器 beautifulsoup 练练
这个 tainiu.html 是从百度网盘里拷贝一段html
  1. from bs4 importBeautifulSoup
  2. with open('tainiu.html','r',encoding ='UTF-8')as f:
  3. html = f.read()
  4. # 这里的编码默认不行 一定要写上 否则报错 
  5. # 应该跟具体情况有关, python 教学视频里 就不写encoding 没错误 实际用 就出问题
  6. soup =BeautifulSoup(html,'html.parser')
  7. alist = soup.find_all(class_='filename')
  8. for a in alist:
  9. print(a.string)
结果:
 
每学网PHP JAVA珍贵学习资源.zip
泰牛程序员 韩顺平 PHP微信开发公开课 01讲 注册属于自己的微信公众平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 02讲 打造自己的微信平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 03讲 PHP大牛班 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 04讲 微信开发模式 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 05讲 接入自己的微信服务器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 06讲 开发简单的微信计算器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 07讲 上节课回顾.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 08讲 SAE使用(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 09讲 SAE使用(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 10讲 SAE与SVN整合(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 11讲 SAE与SVN整合(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 12讲 仿腾讯事实派(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 13讲 仿腾讯事实派(中).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 14讲 仿腾讯事实派(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 15讲 仿腾讯事实派动态调用数据.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 16讲 微信在线音乐点播(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 17讲 微信在线音乐点播(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 18讲 定位地理位置.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 19讲 微信地理位置查询并入库.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 20讲 POI显示地点详情.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 21讲 刮刮乐.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 22讲 幸运大转盘.wmv
泰牛程序员韩顺平 PHP微信开发公开课 PPT 源代码 课堂笔记下载说明.zip
 
呵呵 顺便分享一下 我的视频收藏
链接: http://pan.baidu.com/s/1c2eg9FE 密码: bh3r

python页面解析_beautifulsoup试玩的更多相关文章

  1. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

  2. Python的Web编程[0] -> Web客户端[1] -> Web 页面解析

     Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析.其 ...

  3. 试玩 GOWOG ,初探 OpenAI(使用 NeuroEvolution 神经进化)与 Golang 多人在线游戏开发

    GOWOG: 原项目:https://github.com/giongto35/gowog 我调整过的:https://github.com/Kirk-Wang/gowog GOWOG 是一款迷你的, ...

  4. Python网页解析库:用requests-html爬取网页

    Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

  5. HTML5+JS 《五子飞》游戏实现(七)游戏试玩

    前面第一至第六章我们已经把<五子飞>游戏的基本工作都已经讲得差不多了,这一章主要是把所有的代码分享给大家,然后小伙伴们也可以玩一玩. 至于人机对战的我们放到后面讲进行分析. 试玩地址:ht ...

  6. Python 文本解析器

    Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 ...

  7. ESP32 LyraT音频开发板试玩(一):搭建开发环境

    我是卓波,很高兴你来看我的博客. 系列文章: ESP32 LyraT音频开发板试玩(一):搭建开发环境 ESP32 LyraT音频开发板试玩(二):播放音乐 关于ESP32的开发环境搭建,官方有教程, ...

  8. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. ​ 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存 ...

  9. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

随机推荐

  1. 自己遇到的ajax调用ashx文件无法获取返回值的一种情况

    无法获取返回值的ashx文件大致如下: public void ProcessRequest (HttpContext context) { context.Response.ContentType ...

  2. git之sourceTree使用github和码云的代码小结

    16.使用git出现的错误记录  15. Permission denied (publickey)错误: git远程库与本地库同步 git设置ssh公钥 Bad escape character ' ...

  3. Linux上启动Cron任务

    cron是一个Linux下的定时执行工具,无需人工干预,与quartz上的cron表达式稍有不同.由于cron是Linux上的内置基础服务,并不是所有服务器都是默认启动该服务的,如果没有启动可以使用下 ...

  4. 为运行Microsoft Dynamics CRM 异步处理服务指定账户没有性能计数器权限

    CRM 2016 安装 为运行Microsoft Dynamics CRM 应用程序指定账户没有性能计数器权限 为运行Microsoft Dynamics CRM 异步处理服务指定账户没有性能计数器权 ...

  5. toString 和new String()区别

    public class NewStringTestDemo { public static void main(String[] args) { String s = "你好"; ...

  6. JAVA 每周一 每周日 时间

    Calendar cal = Calendar.getInstance(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd&q ...

  7. SpringMVC 启动流程

    首先看一下Web应用部署初始化过程 (Web Application Deployement),官方文档说明: Web Application Deployment When a web applic ...

  8. js数据类型检测

    目录 1. typeof {} 2. {} instanceof Object 3. {}.constructor === Object 4. Object.property.toString.cal ...

  9. 关于连接oracle工具plsql的一些使用

    上面图片是打开客户端PL\SQL devepoper的连接内容 进入页面后就可以进行相关的sql语句编写了 将几个结果放入一个表中 select 30+30 as 结果 from dual union ...

  10. 一个简单SpringBoot例子

    一:为什么使用springBoot: 有利于开发(整合框架,例如整合了springMVC,Mybatis等框架); 启动无需配置tomcat(java应用程序运行,实际以jar包运行),内置tomca ...