最近玩爬虫,先把python解析器 beautifulsoup 练练
这个 tainiu.html 是从百度网盘里拷贝一段html
  1. from bs4 importBeautifulSoup
  2. with open('tainiu.html','r',encoding ='UTF-8')as f:
  3. html = f.read()
  4. # 这里的编码默认不行 一定要写上 否则报错 
  5. # 应该跟具体情况有关, python 教学视频里 就不写encoding 没错误 实际用 就出问题
  6. soup =BeautifulSoup(html,'html.parser')
  7. alist = soup.find_all(class_='filename')
  8. for a in alist:
  9. print(a.string)
结果:
 
每学网PHP JAVA珍贵学习资源.zip
泰牛程序员 韩顺平 PHP微信开发公开课 01讲 注册属于自己的微信公众平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 02讲 打造自己的微信平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 03讲 PHP大牛班 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 04讲 微信开发模式 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 05讲 接入自己的微信服务器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 06讲 开发简单的微信计算器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 07讲 上节课回顾.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 08讲 SAE使用(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 09讲 SAE使用(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 10讲 SAE与SVN整合(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 11讲 SAE与SVN整合(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 12讲 仿腾讯事实派(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 13讲 仿腾讯事实派(中).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 14讲 仿腾讯事实派(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 15讲 仿腾讯事实派动态调用数据.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 16讲 微信在线音乐点播(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 17讲 微信在线音乐点播(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 18讲 定位地理位置.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 19讲 微信地理位置查询并入库.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 20讲 POI显示地点详情.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 21讲 刮刮乐.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 22讲 幸运大转盘.wmv
泰牛程序员韩顺平 PHP微信开发公开课 PPT 源代码 课堂笔记下载说明.zip
 
呵呵 顺便分享一下 我的视频收藏
链接: http://pan.baidu.com/s/1c2eg9FE 密码: bh3r

python页面解析_beautifulsoup试玩的更多相关文章

  1. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

  2. Python的Web编程[0] -> Web客户端[1] -> Web 页面解析

     Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析.其 ...

  3. 试玩 GOWOG ,初探 OpenAI(使用 NeuroEvolution 神经进化)与 Golang 多人在线游戏开发

    GOWOG: 原项目:https://github.com/giongto35/gowog 我调整过的:https://github.com/Kirk-Wang/gowog GOWOG 是一款迷你的, ...

  4. Python网页解析库:用requests-html爬取网页

    Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

  5. HTML5+JS 《五子飞》游戏实现(七)游戏试玩

    前面第一至第六章我们已经把<五子飞>游戏的基本工作都已经讲得差不多了,这一章主要是把所有的代码分享给大家,然后小伙伴们也可以玩一玩. 至于人机对战的我们放到后面讲进行分析. 试玩地址:ht ...

  6. Python 文本解析器

    Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 ...

  7. ESP32 LyraT音频开发板试玩(一):搭建开发环境

    我是卓波,很高兴你来看我的博客. 系列文章: ESP32 LyraT音频开发板试玩(一):搭建开发环境 ESP32 LyraT音频开发板试玩(二):播放音乐 关于ESP32的开发环境搭建,官方有教程, ...

  8. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. ​ 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存 ...

  9. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

随机推荐

  1. axiso实战问题

    this.axios({ method: 'get', url: '/api/projectmgt/project/Project/list', withCredentials : true, hea ...

  2. Flask--(项目准备)--框架搭建,参数配置

    项目准备: 配置参数 项目配置: 新建工程: 配置虚拟环境: 通过配置类添加配置参数: Debug配置, 初始化数据库对象, Mysql配置及数据库创建 redis配置: 端口6379和域名: 创建存 ...

  3. keil5 MDK warning:registered ARM compiler version not found in path

    重装 打开keil5弹出窗口: warning:registered ARM compiler version not found in path... 解决: 增加系统环境变量 ARMCC5LIB ...

  4. Java如何运行一个class文件的main方法

    假设如下目录有个class文件,并且里面有main方法: d:\workspace\eclipse\com\JavaCore\classloader\MyClassLoader.class 首先进入c ...

  5. Program type already present: android.support.v4.widget.EdgeEffectCompat

    1.确保所有依赖包的 implementation 'com.android.support:appcompat-v7:25.4.0'是一样的 2.确保最外层的build.gradle中增加如下代码: ...

  6. Codeforces Round #551 (Div. 2) A-E

    A. Serval and Bus 算出每辆车会在什么时候上车, 取min即可 #include<cstdio> #include<algorithm> #include< ...

  7. Servlet的几个关键知识点

    1.ServletConfig ServletConfig是Servlet的配置文件.对应于web.xml中的<servlet></servlet>标签.ServletConf ...

  8. kettle实现多表同步

    本样例实现源库的所有表到目标库的同步sqlserver=>mysql(目标表存在表结构则同步),总调度如下: 由于复制记录到结果保存了多个表名,存在多个值,在高级选择对每个输入行执行一次进行循环 ...

  9. python TKinter部分记录

    http://blog.shouji-zhushou.com/python-gui-tkinter-grid%E7%BD%91%E6%A0%BC%E5%87%A0%E4%BD%95%E5%B8%83% ...

  10. Java Bug -- java.util.ConcurrentModificationException

    java.util.ConcurrentModificationException at java.util.ArrayList$ArrayListIterator.next(ArrayList.ja ...