最近玩爬虫,先把python解析器 beautifulsoup 练练
这个 tainiu.html 是从百度网盘里拷贝一段html
  1. from bs4 importBeautifulSoup
  2. with open('tainiu.html','r',encoding ='UTF-8')as f:
  3. html = f.read()
  4. # 这里的编码默认不行 一定要写上 否则报错 
  5. # 应该跟具体情况有关, python 教学视频里 就不写encoding 没错误 实际用 就出问题
  6. soup =BeautifulSoup(html,'html.parser')
  7. alist = soup.find_all(class_='filename')
  8. for a in alist:
  9. print(a.string)
结果:
 
每学网PHP JAVA珍贵学习资源.zip
泰牛程序员 韩顺平 PHP微信开发公开课 01讲 注册属于自己的微信公众平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 02讲 打造自己的微信平台.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 03讲 PHP大牛班 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 04讲 微信开发模式 .wmv
泰牛程序员 韩顺平 PHP微信开发公开课 05讲 接入自己的微信服务器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 06讲 开发简单的微信计算器.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 07讲 上节课回顾.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 08讲 SAE使用(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 09讲 SAE使用(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 10讲 SAE与SVN整合(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 11讲 SAE与SVN整合(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 12讲 仿腾讯事实派(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 13讲 仿腾讯事实派(中).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 14讲 仿腾讯事实派(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 15讲 仿腾讯事实派动态调用数据.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 16讲 微信在线音乐点播(上).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 17讲 微信在线音乐点播(下).wmv
泰牛程序员 韩顺平 PHP微信开发公开课 18讲 定位地理位置.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 19讲 微信地理位置查询并入库.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 20讲 POI显示地点详情.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 21讲 刮刮乐.wmv
泰牛程序员 韩顺平 PHP微信开发公开课 22讲 幸运大转盘.wmv
泰牛程序员韩顺平 PHP微信开发公开课 PPT 源代码 课堂笔记下载说明.zip
 
呵呵 顺便分享一下 我的视频收藏
链接: http://pan.baidu.com/s/1c2eg9FE 密码: bh3r

python页面解析_beautifulsoup试玩的更多相关文章

  1. python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

    本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding: ...

  2. Python的Web编程[0] -> Web客户端[1] -> Web 页面解析

     Web页面解析 / Web page parsing 1 HTMLParser解析 下面介绍一种基本的Web页面HTML解析的方式,主要是利用Python自带的html.parser模块进行解析.其 ...

  3. 试玩 GOWOG ,初探 OpenAI(使用 NeuroEvolution 神经进化)与 Golang 多人在线游戏开发

    GOWOG: 原项目:https://github.com/giongto35/gowog 我调整过的:https://github.com/Kirk-Wang/gowog GOWOG 是一款迷你的, ...

  4. Python网页解析库:用requests-html爬取网页

    Python网页解析库:用requests-html爬取网页 1. 开始 Python 中可以进行网页解析的库有很多,常见的有 BeautifulSoup 和 lxml 等.在网上玩爬虫的文章通常都是 ...

  5. HTML5+JS 《五子飞》游戏实现(七)游戏试玩

    前面第一至第六章我们已经把<五子飞>游戏的基本工作都已经讲得差不多了,这一章主要是把所有的代码分享给大家,然后小伙伴们也可以玩一玩. 至于人机对战的我们放到后面讲进行分析. 试玩地址:ht ...

  6. Python 文本解析器

    Python 文本解析器 一.课程介绍 本课程讲解一个使用 Python 来解析纯文本生成一个 HTML 页面的小程序. 二.相关技术 Python:一种面向对象.解释型计算机程序设计语言,用它可以做 ...

  7. ESP32 LyraT音频开发板试玩(一):搭建开发环境

    我是卓波,很高兴你来看我的博客. 系列文章: ESP32 LyraT音频开发板试玩(一):搭建开发环境 ESP32 LyraT音频开发板试玩(二):播放音乐 关于ESP32的开发环境搭建,官方有教程, ...

  8. Python爬虫解析网页的4种方式 值得收藏

    用Python写爬虫工具在现在是一种司空见惯的事情,每个人都希望能够写一段程序去互联网上扒一点资料下来,用于数据分析或者干点别的事情. ​ 我们知道,爬虫的原理无非是把目标网址的内容下载下来存储到内存 ...

  9. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

随机推荐

  1. DataSource - 常用数据库连接池 (DBCP、c3p0、Druid) 配置说明

    1. 引言 1.1 定义 数据库连接是一种关键的有限的昂贵的资源,这一点在多用户的网页应用程序中体现得尤为突出.对数据库连接的管理能显著影响到整个应用程序的伸缩性和健壮性,影响到程序的性能指标.数据库 ...

  2. 红米note3发热严重,小米真垃圾!

    红米note3全网通高配版,高通处理器骁龙650(MSM8956),夏天在有空调的房间,上网几分钟手机发烫,真垃圾! ROM已经是官方最新稳定版.MIUI8.5.2.0(LHNCNED) 红米NOTE ...

  3. 廖雪峰Java7处理日期和时间-2Data和Calendar-2Calendar

    Calendar类 历史上有许多纪年方法,其差异太大了.为了统一计时,通常采用格里高利日历. 1.创建Calendar对象 Calenda类是一个抽象类,所以不能使用构造器来创建Calendar对象. ...

  4. C++Primer第五版——习题答案详解(十)

    习题答案目录:https://www.cnblogs.com/Mered1th/p/10485695.html 第11章 关联容器 练习11.3 #include<iostream> #i ...

  5. Handling Touches - RN3

    1. basic button format: <tag event caption /> <Button onPress={{}} title="I am button& ...

  6. java 栈 最大深度

      1. 概述 某公司面试,总监大叔过来,问了图论及栈的最大深度,然后^_^ 一直记着,今天搞一下 2. 代码 package com.goodfan.test; public class JavaS ...

  7. springboot发送邮件

    1.在发送端邮箱平台开通SMTP服务 1)以163邮箱为例: step 1: step 2: 2.编写代码: 1)添加发送邮箱maven依赖 <dependency> <groupI ...

  8. 编程最好用的字体consolas

    python 自带idle最好用的字体consolas https://www.icourse163.org/learn/BIT-268001?tid=1002788003#/learn/forumd ...

  9. leetcode39

    public class Solution { List<IList<int>> list = new List<IList<int>>();//全部记 ...

  10. 003之MFCSocket异步编程(指针机制)

    002篇是采用传统方式创建,不适应动态的网络环境,服务器为客户端保留着断开连接时的套接字,不够灵活.而采用指针机制不仅可以更加灵活性,而且能使代码更集中,更具有条理性.将其转变成指针机制.功能及运行保 ...