# 1.把之间案例,使用bs4,正则,xpath,进行数据提取. # 2.爬取拉钩网上的所有python职位. from urllib import request,parse import json,random #导入xlsxwriter 主要用于生成excel表格对象 import xlsxwriter #创建python的职位类 class python_position: def __init__(self,page,number): self.page = page self.num…
首先我们前期要导入的第三方类库有; 通过猫眼电影100榜的源码可以看到很有规律 如: 亦或者是: 根据规律我们可以得到非贪婪的正则表达式 """<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?releasetime">(.*?)</p>""&q…
import requests import time, random, csv from fake_useragent import UserAgent from bs4 import BeautifulSoup from threadpool import ThreadPool, makeRequests def request_url(city_code, city_name, city_letter): """ 请求主页 """ with…
import requests import json import re import csv import threadpool import time, random from bs4 import BeautifulSoup from fake_useragent import UserAgent def hotel(city_letter, city_num, city_name): with open('has_address.json', 'a+', encoding="utf-8…
xlwt 1.3.0 xlwt 文档 xlrd 1.1.0 python操作excel之xlrd 1.Python模块介绍 - xlwt ,什么是xlwt? Python语言中,写入Excel文件的扩展工具. 相应的有扩展包xlrd,专门用于excel读取. 可以实现指定表单.指定单元格的写入. 2.xlwt使用 导入模块 import xlwt 创建workbook,即创建excel,后来要进行保存 workbook = xlwt.Workbook(encoding = 'utf-8') 创建…
1.re实现 import re,os import requests from requests.exceptions import RequestException MAX_PAGE = 10 #最大页数 KEYWORD = 'python' headers = { 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/…
1.re实现 import requests from requests.exceptions import RequestException import re,json import xlwt,xlrd # 数据 DATA = [] KEYWORD = 'python' HEADERS = {'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome'\ '/63.0.…
第一步:下载xlwt 首先要下载xlwt,(前提是你已经安装好了Python) 下载地址:  https://pypi.python.org/pypi/xlwt/   下载第二个   第二步:安装xlwt 打开cmd,切换目录到你下载的文件地址 输入python setup.py install,就安装成功了.   第三步:案例 第一个demo案例(我的python是在Eclipse环境下编写的)   #coding=utf-8  ''''' Created on 2016年1月22日 @aut…
# coding=utf-8 import os import time from selenium import webdriver from selenium.webdriver.chrome.options import Options from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium.webdr…
1.先导入相应的jar包 2.一个小的Demo测试[实体类+测试类:保存excel的方法] Student实体类 public class Student{ private int id; private String name; private String email; private Date birth; //相应的set.get方法 还有构造器(有参.无参的) ··············· } Test测试类 public class Test{ public static List…