爬取房价信息并制作成柱状图XPath，pyecharts

以长沙楼盘为例，看一下它的房价情况如何url = https://cs.newhouse.fang.com/house/s/b91/

一、页面

二、分析页面源代码

我们要获得的数据就是名字和价格，先来分析一下源代码，鼠标右键Inspect，并且打开xpath，第一步，找到需要提取数据的区域，选中定位到代码相应位置，然后右击copy xpath到xpath里面去，可以发现插件中右侧results有一个，就是下面那片黄色的区域，即我们要提取的数据。

好了，网页部分已经了解了，那么接下来就是用代码抓取数据了。

三、代码实现

成果图：

play.py

#!/usr/bin/env python

# _*_ coding: UTF-8 _*_

"""=================================================

@Project -> File    : Operate_system_ModeView_structure -> play.py

@IDE     : PyCharm

@Author  : zihan

@Date    : 2020/5/6 14:59

@Desc    :

================================================="""

import requests

from lxml import etree

from pyecharts.charts import Bar

import pyecharts.options as opts

def getData():

    url = "https://cs.newhouse.fang.com/house/s/b91/"

    headers = {

        'User-Agent': ""

    }

    response = requests.get(url, headers=headers)  # 发送请求

    data= response.content.decode(encoding='gbk')

    html = etree.HTML(data)

    house_list = html.xpath('//div[@class="nl_con clearfix"]/ul/li')

    names = []

    prices = []

    for i in house_list:

        name = i.xpath('.//div[@class="nlcd_name"]/a/text()')

        price = i.xpath('.//div[@class="nhouse_price"]/span/text()')

        if name != [] and price != []:

            if price != ['价格待定']:

                name = name[0].strip()

                names.append(name)

                price = price[0]

                prices.append(price)

    return names, prices

def main():

    print("main() func is starting...")

    names, prices = getData()

    # print(names)

    # print(prices)

    bar = Bar()

    bar.add_xaxis(names)

    bar.add_yaxis('长沙房价图', prices)

    bar.set_global_opts(

            xaxis_opts=opts.AxisOpts(

                axislabel_opts=opts.LabelOpts(rotate=40),

            ),

        yaxis_opts=opts.AxisOpts(name="价格（元、平方米）"),

        title_opts=opts.TitleOpts(title="柱状图")

    )

    bar.render('房价图.html')

if __name__ == '__main__':

    main()

好了。

爬取房价信息并制作成柱状图XPath，pyecharts的更多相关文章

Python爬取招聘信息，并且存储到MySQL数据库中
前面一篇文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为前一天的,同时将爬取的内容保存到数据库中:这篇文章主要讲述如何将python文件压缩成exe可执行文件,供后面的操作. 这系列文章 ...
[python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】
[python] 常用正则表达式爬取网页信息及分析HTML标签总结转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...
Python爬虫小实践：寻找失踪人口，爬取失踪儿童信息并写成csv文件，方便存入数据库
前两天有人私信我,让我爬这个网站,http://bbs.baobeihuijia.com/forum-191-1.html上的失踪儿童信息,准备根据失踪儿童的失踪时的地理位置来更好的寻找失踪儿童,这种 ...
Python爬虫之selenium爬虫，模拟浏览器爬取天猫信息
由于工作需要,需要提取到天猫400个指定商品页面中指定的信息,于是有了这个爬虫.这是一个使用 selenium 爬取天猫商品信息的爬虫,虽然功能单一,但是也算是 selenium 爬虫的基本用法了. ...
python学习之——爬取网页信息
爬取网页信息说明:正则表达式有待学习,之后完善此功能 #encoding=utf-8 import urllib import re import os #获取网络数据到指定文件 def getHt ...
Python-王者荣耀自动刷金币+爬取英雄信息+图片
前提:本文主要功能是 1.用python代刷王者荣耀金币 2.爬取英雄信息 3.爬取王者荣耀图片之类的. (全部免费附加源代码) 思路:第一个功能是在基于去年自动刷跳一跳python代码上面弄的,思路 ...
常用正则表达式爬取网页信息及HTML分析总结
Python爬取网页信息时,经常使用的正则表达式及方法. 1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容 3 ...
python爬取酒店信息练习
爬取酒店信息,首先知道要用到那些库.本次使用request库区获取网页,使用bs4来解析网页,使用selenium来进行模拟浏览. 本次要爬取的美团网的蚌埠酒店信息及其评价.爬取的网址为“http:/ ...
Python爬取网页信息
Python爬取网页信息的步骤以爬取英文名字网站(https://nameberry.com/)中每个名字的评论内容,包括英文名,用户名,评论的时间和评论的内容为例. 1.确认网址在浏览器中输入初 ...

随机推荐

【NX二次开发】Block UI 文本颜色/字体/宽度
属性说明常规类型描述 BlockID String 控件ID Enable Logical 是否可操作 Group Logical 是否分 ...
『无为则无心』Python基础 — 2、编译型语言和解释型语言的区别
目录 1.什么是计算机语言 2.高级语言中的编译型语言和解释型语言 (1)编译型语言 (2)解释型语言 (3)编译型语言和解释型语言执行流程 3.知识扩展: 4.关于Python 1.什么是计算机语言 ...
Java第二次博客作业
Java第二次博客作业时间过的很快啊,在不知不觉中这门课程的学习也就快要过去一半了,现在就来总结一下在这个第二个月的学习当中存在的问题以及得到的心得. 1.前言第四次题目集和第五次题目集给我的感觉 ...
WPF中ListView控件怎么添加新的tiem时滚动条一直在最下面
listBox.ScrollIntoView(listBox.Items[listBox.Items.Count - 1])
OpenResty高并发
在电商项目中所有的访问都是通过首页访问进去的,那么首页门户的访问频率会是非常高的,用我们专业术语来说就是并发量高,这时问题就来了,并发量高我们在做程序时就要保证首页的抗压能力强,而且还要保证抗压的同时 ...
vscode中html和vue没有自动补全，需要怎么配置
先安装HTML Snippets插件点击文件-首选项-设置,然后根据以下操作然后在setting.json中加入以下代码然后就有提示了
sql循环说明
while循环:主要是判断,不能使用表中的ID,临时表是ID自增的,通过自增ID可以查出表ID(语法简单,需要配合其他代码操作表ID)游标循环:可以使用表中的ID ,进行修改等操作(语法难一点,核心代 ...
Java操作SQL数据库(JDBC)
0.引入驱动jar包使用jdbc进行具体操作前,需要引入相关数据库的jar包, 或者使用mave管理依赖 <!-- https://mvnrepository.com/artifact/mys ...
Redmine部署
Redmine部署文章: 第一篇:Redmine部署第二篇:Redmine部署中遇到的问题部门内部需要项目开发维护的网站,这种网站有付费的,也有开源项目.这类项目管理与协作的工具主要的MS Sha ...
5、cobbler搭建本地saltstack yum仓库
5.1.安装cobbler: 参考"linux运维_集群_01(35.cobbler自动化安装操作系统:)" 5.2.cobbler yum源常用操作命令: cobbler rep ...

爬取房价信息并制作成柱状图XPath，pyecharts

爬取房价信息并制作成柱状图XPath，pyecharts的更多相关文章

随机推荐

热门专题