Python爬取数据并保存到csv文件中

1、数据源

2、Python代码

import requests

from lxml import etree

import csv

url = 'http://211.103.175.222:5080/zentaopms/www/index.php?m=project&f=task&projectID=830'

headers = {

	'Cookie': 'lang=zh-cn; device=desktop; theme=default; feedbackView=0; lastProject=830; preProjectID=830; lastTaskModule=0; projectTaskOrder=status%2Cid_desc; pagerProjectTask=2000; keepLogin=on; za=zhangyh01; zp=2a7befd1193619083ca09e00e186dc709a5722c2; windowWidth=1707; windowHeight=679; zentaosid=revjktmd869d6q7ilfhrjp1bpn'

}

res = requests.get(url,headers=headers)

res.encoding = 'utf-8'

tree = etree.HTML(res.text)

trs = tree.xpath('//*[@id="taskList"]/tbody/tr')

f = open('result.csv',mode='w',newline='')  # newline='':防止保存的csv文件有空行

csv_writer = csv.writer(f)

for tr in trs:

	id = tr.xpath('./td[1]/a/text()')[0]

	jb = tr.xpath('./td[2]/span/text()')[0]

	title = tr.xpath('./td[3]/a/text()')[0]

	name = tr.xpath('./td[5]/a/span/text()')[0]

	wcl = tr.xpath('./td[10]/text()')[0]

	csv_writer.writerow([id,jb,title,name,wcl])

	print('完成一行------------' + id,jb,title,name,wcl)

f.close()

print('全部完成')

3、执行过程

4、保存的结果

Python爬取数据并保存到csv文件中的更多相关文章

使用scrapy爬取的数据保存到CSV文件中，不使用命令
pipelines.py文件中 import codecs import csv # 保存到CSV文件中 class CsvPipeline(object): def __init__(self): ...
使用pandas中的raad_html函数爬取TOP500超级计算机表格数据并保存到csv文件和mysql数据库中
参考链接:https://www.makcyun.top/web_scraping_withpython2.html #!/usr/bin/env python # -*- coding: utf-8 ...
实现多线程爬取数据并保存到mongodb
多线程爬取二手房网页并将数据保存到mongodb的代码: import pymongo import threading import time from lxml import etree impo ...
python爬取当当网的书籍信息并保存到csv文件
python爬取当当网的书籍信息并保存到csv文件依赖的库: requests #用来获取页面内容 BeautifulSoup #opython3不能安装BeautifulSoup,但可以安装Bea ...
node 爬虫 --- 将爬取到的数据，保存到 mysql 数据库中
步骤一:安装必要模块 (1)cheerio模块 ,一个类似jQuery的选择器模块,分析HTML利器. (2)request模块,让http请求变的更加简单 (3)mysql模块,node连接mysq ...
Python爬取爬取明星关系并写入csv文件
今天用Python爬取了明星关系,数据不多,一共1386条数据,代码如下: import requests from bs4 import BeautifulSoup import bs4 impor ...
直接把数据库中的数据保存在CSV文件中
今天突然去聊就来写一个小小的demo喽,嘿嘿 public partial class Form1 : Form { public Form1() { InitializeComponent(); } ...
python爬取数据保存到Excel中
# -*- conding:utf-8 -*- # 1.两页的内容 # 2.抓取每页title和URL # 3.根据title创建文件,发送URL请求,提取数据 import requests fro ...
python爬取数据需要注意的问题
1 爬取https的网站或是接口的时候,如果是不受信用的SSL证书,会报错,需要添加如下代码,如下代码可以保证当前代码块内所有的请求都自动屏蔽ssl证书问题: import ssl # 这个是爬取ht ...
python爬取数据保存入库
import urllib2 import re import MySQLdb class LatestTest: #初始化 def __init__(self): self.url="ht ...

随机推荐

easyExcel合并数据导出(一对多)
语言 java 框架 ssm 需求 :看图也是导出效果数据库查询为(关系为一对多) 一个学生对应多个课程实现步骤 1.实体类配置, 建议单独写个实体用来导出使用() 学生信息字段正常配置 , ...
攻防世界 debug
题目分析过程丢到PE里面一开始,我看到下面的脱壳提示,以为是我没见过的壳,下载了相关工具脱壳--发现脱了后又出现没见过的脱壳提示,根据提示脱壳弄出来的东西怪怪的卡题,查了资料学到一个新知识点 ...
identity4 系列————用户数据持久化篇[六]
前言前面的例子已经将各种情形下的例子已经介绍了一遍,那么后面就是用户数据持久化该如何处理了. 正文例子位置: https://github.com/IdentityServer/IdentityS ...
redis 简单整理——redis 的集合基本结构和命令[五]
前言简单介绍一下集合的基本结构和命令. 正文集合(set)类型也是用来保存多个的字符串元素,但和列表类型不一样的是,集合中不允许有重复元素,并且集合中的元素是无序的,不能通过索引下标获取元素. ...
React纯组件的使用
1. 有无必要使用纯组件如果应用不是很大型,页面渲染效率使用纯组件与非纯组件差别不大,尽量使用组件应用一定注意,setState时子组件依赖渲染的属性一定要传递给子组件,不然父组件setState ...
Spark SQL 抽样函数 ——TABLESAMPLE 的坑点
最近需要实现一段 Spark SQL 逻辑,对数据集进行抽样指定的行数. 由于数据集较大,刚开始的逻辑是,取窗口函数随机排序后 row_number 的前 n 行.但运行速度较慢,所以想起了 TABL ...
力扣1098(MySQL)-小众书籍（中等）
题目: 书籍表 Books: book_id 是这个表的主键订单表 Orders: order_id 是这个表的主键.book_id 是 Books 表的外键. 问题你需要写一段 SQL 命令,筛选 ...
力扣6(java)-Z字形变换（中等）
题目: 将一个给定字符串 s 根据给定的行数 numRows ,以从上往下.从左到右进行 Z 字形排列. 比如输入字符串为 "PAYPALISHIRING" 行数为 3 时,排列如 ...
几种Java常用序列化框架的选型与对比
简介: 序列化与反序列化是我们日常数据持久化和网络传输中经常使用的技术,但是目前各种序列化框架让人眼花缭乱,不清楚什么场景到底采用哪种序列化框架.本文会将业界开源的序列化框架进行对比测试,分别从通用性 ...
干货｜一文读懂阿里云数据库Autoscaling是如何工作的
简介: 阿里云数据库实现了其特有的Autosaling能力,该能力由数据库内核.管控及DAS(数据库自治服务)团队共同构建,内核及管控团队提供了数据库Autoscaling的基础能力,DAS则负责性能 ...

Python爬取数据并保存到csv文件中

Python爬取数据并保存到csv文件中的更多相关文章

随机推荐

热门专题