bs4解析-湖南农场品价格行情

import requests

from bs4 import BeautifulSoup

import csv

url = 'https://price.21food.cn/market/174-p1.html'

headers = {

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.41'

}

resp = requests.get(url=url, headers=headers)

# print(resp.text)

# 解析数据

# 1.把页面源代码交给BeautifulSoup进行处理，生成bs对象

page = BeautifulSoup(resp.text, 'html.parser')  # 设置解析器

# 2.从bs对象中查找数据

# find(标签，属性=值)

# find_all(标签，属性=值)

# 定位到一个方便提取具体数值的地方

# div = page.find('div',class_='sjs_top_cent_erv') # class是python关键字，所以要写成class_

div = page.find('div', attrs={"class": "sjs_top_cent_erv"})  # 和上一行是一个意思，此时可以避免class

# 拿到所有数据行

# 进行切片，不要第一个tr 第一个tr是每一个列标题

trs = div.find_all('tr')[1:]

# 存储文件

f = open('data.csv', mode='w', encoding='utf-8', newline='')  # newline = ''

# 备注：如果没有指定 newline=‘’，则嵌入引号中的换行符将无法正确解析，并且在写入时，使用 \r\n 换行的平台会有多余的 \r 写入。

csvwriter = csv.writer(f)

for tr in trs:  # 每一行的数据

    tds = tr.find_all('td')  # 拿到行中的所有td

    name = tds[0].text  # .text 表示拿到被标签标记的内容

    market = tds[1].text

    spe = tds[2].text

    max = tds[3].text

    min = tds[4].text

    ave = tds[5].text

    date = tds[6].text

    csvwriter.writerow([name, market, spe, max, min, ave, date])  # 放到csv文件里

resp.close()

f.close()

print("完成！！！")

bs4解析-湖南农场品价格行情的更多相关文章

bs4解析库
beautifulsoup4 bs4解析库是灵活又方便的网页解析库,处理高效,支持多种解析器.利用它不用编写正则表达式即可方便地实现网页的提取要解析的html标签 from bs4 import B ...
bs4 解析以及用法
bs4解析 bs4: 环境安装: lxml bs4 bs4编码流程: 1.实例化一个bs4对象,且将页面源码数据加载到该对象中 2.bs相关的方法或者属性实现标签定位 3.取文本或者取属性 bs的属性 ...
Python3.x：bs4解析html基础用法
Python3.x:bs4解析html基础用法代码: import urllib.request from bs4 import BeautifulSoup import re url = r'ht ...
爬虫的三种解析方式(正则解析, xpath解析, bs4解析)
一 : 正则解析 : 常用正则回顾: 单字符: . : 除换行符以外的所有字符 [] : [aoe] [a-w] 匹配集合中任意一个字符 \d : 数字 [0-9] \D : 非数字 \w : 非数字 ...
bs4解析
介绍:将一个html文档转换成BeautifulSoup对象,然后通过对象的方法或属性查找指定的节点内容转换本地文件: soup = BeautifulSoup(fp,'lxml') fp为文档 ...
python bs4解析网页时 bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need to inst（转）
Python小白,学习时候用到bs4解析网站,报错 bs4.FeatureNotFound: Couldn't find a tree builder with the features you re ...
爬虫系列二(数据清洗--->bs4解析数据)
一 BeautifulSoup解析 1 环境安装 - 需要将pip源设置为国内源,阿里源.豆瓣源.网易源等 - windows (1)打开文件资源管理器(文件夹地址栏中) (2)地址栏上面输入 %ap ...
pytho爬虫使用bs4 解析页面和提取数据
页面解析和数据提取关注公众号"轻松学编程"了解更多. 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值.内容一般分为两部分,非结构化的数据和结构化的 ...
bs4解析要获取被注掉的部分需先将注释符号去掉
<div class="xzcf-content"> <div id="sfxz"> <div class="main- ...
爬虫的两种解析方式 xpath和bs4
1.xpath解析 from lxml import etree 两种方式使用:将html文档变成一个对象,然后调用对象的方法去查找指定的节点 (1)本地文件 tree = etree.parse(文 ...

随机推荐

golang基础之结构体
匿名结构体在定义一些临时数据结构等场景下还可以使用匿名结构体. 在函数体内 package main import ( "fmt" ) func main() { //方法一 v ...
Oracle修改字段长度及属性
首发微信公众号:SQL数据库运维原文链接:https://mp.weixin.qq.com/s?__biz=MzI1NTQyNzg3MQ==&mid=2247486117&idx=1 ...
postgresql 创建索引
--查询索引 select * from pg_indexes where tablename='tab1'; --创建索引(查询用到哪几列,就对哪几个字段创建索引) CREATE INDEX ind ...
AIRIOT答疑第2期|如何使用物联网平台的数据采集与控制引擎？
任性用! 作为AIRIOT物联网低代码平台的五大核心能力引擎之一,数据采集与控制引擎具备极强的系统集成能力,提供丰富的接口,具备海量工业设备驱动库,分布式采集,稳定性高,实现快速的设备接入.报警. ...
统计学习：EM算法及其在高斯混合模型(GMM)中的应用
1. EM算法的基本思想我们在应用中所面对的数据有时是缺损的/观测不完全的[1][2].我们将数据分为: 可观测数据,用\(Y\)表示: 缺失数据,用\(Z\)表示; 完全数据,用\(X=(Y, Z ...
【题解】A18747.眼红的同学
题目链接:眼红的同学题干信息很简单,看到数据量之后就不简单了.在数据量小的时候可以使用双层循环暴力的方法来求答案.显然对于这道题而言O(n^2)是完全过不去的. 前置知识: 使用树状数组求逆序对会 ...
jsonp原理详解——终于弄明白了JSONP
什么是JSONP? 其实网上关于JSONP的讲解有很多,但却千篇一律,而且云里雾里,对于很多刚接触的人来讲理解起来有些困难,着用自己的方式来阐释一下这个问题,看看是否有帮助. 1.一个众所周知的问题, ...
Python爬图片
1 import requests 2 from lxml import etree 3 4 header = { 5 "user-agent": "Mozilla/5. ...
CSS操作——边框属性
1.border-style(边框风格) 定义边框的风格,值可以有: /* none:没有边框,当border的值为none的时候,系统将会忽略[border-color] hidden:隐藏边框,低 ...
IPsecVPN 服务器一键安装脚本
IPsec VPN 服务器一键安装脚本使用 Linux 脚本一键快速搭建自己的 IPsec VPN 服务器.支持 IPsec/L2TP, Cisco IPsec 和 IKEv2 协议.你只需提供自己 ...

bs4解析-湖南农场品价格行情

bs4解析-湖南农场品价格行情的更多相关文章

随机推荐

热门专题