抓取腾讯招聘python岗位

# -*- coding: utf-8 -*-

"""

@author: Dell Created on Mon Dec 23 17:55:06 2019

"""

import re

import time

import requests

from lxml import etree

from selenium import webdriver

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC

from selenium.webdriver.common.by import By

HEADERS = {

    # 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36',

    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',

    'Referer': 'https://careers.tencent.com/',

    'Accept': 'application/json, text/javascript, */*; q=0.01'

}

def parse(url):

    driver= webdriver.Chrome()

    driver.get(url)

    text = driver.page_source

    # resp = requests.get(url, headers=HEADERS)

    # text = resp.content.decode("utf-8", errors="ignore")

    #解析网页

    html = etree.HTML(text)

    divs = html.xpath("//div[@class='recruit-list']")

    pos_infos = []

    for div in divs:

        title = div.xpath("./a/h4/text()")[0]#提取职位名称

        address = div.xpath("./a/p/span[2]/text()")[0]#提取职位工作地点

        require = div.xpath("./a/p[@class='recruit-text']/text()")[0]#提取职位要求

        pos_info = {'title':title, 'address':address, 'require':require}

        pos_infos.append(pos_info)

    driver.close()

    return pos_infos

def save(list):

    with open("tencent.txt", "a+", encoding="utf-8") as f:

        for line in list:

            f.write(str(line) + "\n")

if __name__ == "__main__":

    baseurl = "https://careers.tencent.com/search.html?index={}&keyword=python"

    for i in range(1,70):

        url = baseurl.format(i)

        pos_list = parse(url)

        save(pos_list)

        for pos in pos_list:

            print(pos)

        print("第%s页解析完成" % str(i), "-" * 50)

    pass

抓取腾讯招聘python岗位的更多相关文章

用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
用python实现的抓取腾讯视频所有电影的爬虫
1. [代码]用python实现的抓取腾讯视频所有电影的爬虫 # -*- coding: utf-8 -*-# by awakenjoys. my site: www.dianying.atim ...
Python爬虫实现抓取腾讯视频所有电影【实战必学】
2019-06-27 23:51:51 阅读数 407 收藏更多分类专栏: python爬虫前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问 ...
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息
简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息简单的scrapy实战:爬取腾讯招聘北京地区的相关招聘信息系统环境:Fedora22(昨天已安装scrapy环境) 爬取的开始URL:ht ...
用生产者消费模型爬取智联招聘python岗位信息
爬取python岗位智联招聘这里爬取北京地区岗位招聘python岗位,并存入EXECEL文件内,代码如下: import json import xlwt import requests from ...
paip.抓取网页内容--java php python
paip.抓取网页内容--java php python.txt 作者Attilax 艾龙, EMAIL:1466519819@qq.com 来源:attilax的专栏地址:http://blog ...
【Python3 爬虫】16_抓取腾讯视频评论内容
上一节我们已经知道如何使用Fiddler进行抓包分析,那么接下来我们开始完成一个简单的小例子抓取腾讯视频的评论内容首先我们打开腾讯视频的官网https://v.qq.com/ 我们打开[电视剧]这 ...
Python 爬取腾讯招聘职位详情 2019/12/4有效
我爬取的是Python相关职位,先po上代码,(PS:本人小白,这是跟着B站教学视频学习后,老师留的作业,因为腾讯招聘的网站变动比较大,老师的代码已经无法运行,所以po上),一些想法和过程在后面. f ...
NetCloud——一个网易云音乐评论抓取和分析的Python库
在17的四月份,我曾经写了一篇关于网易云音乐爬虫的文章,还写了一篇关于评论数据可视化的文章.在这大半年的时间里,有时会有一些朋友给我发私信询问一些关于代码方面的问题.所以我最近抽空干脆将原来的代码整理 ...

随机推荐

虚树+【BZOJ2286】【SDOI2011】消耗战（虚树）（DP）
先看一道题: [BZOJ2286][SDOI2011]消耗战 Description 在一场战争中,战场由n个岛屿和n−1个桥梁组成,保证每两个岛屿间有且仅有一条路径可达.现在,我军已经侦查到敌军的总 ...
Forest Program（dfs方法---树上的环）
题意:http://acm.hdu.edu.cn/showproblem.php?pid=6736 沙漠中的每一个连通块都是一棵仙人掌:一个连通块是一棵仙人掌当且仅当连通块中不存在重边和自环,并且每一 ...
Go语言Mac、Linux、Windows 下交叉编译
在很多时候,由于开发的方便,会有这样的场景出现,使用Mac开发或使用Windows开发,需要编译成Linux系统的执行文件,那么如何做到?Go语言提供了非常方便的命令行操作,即可实现. 1.Mac下编 ...
今天遇到了不能创建mysql函数
今天用navicat 不能创建函数,查询了 MySQL函数不能创建,是未开启功能: mysql> show variables like '%func%'; +----------------- ...
javascript的一些有用函数记录，不断更新。。。
addLoadEvent函数: 众所周知,html文档加载完后会立即执行一个onload函数.但是onload函数只能包含一个被执行的函数,也就是你需要在加载完文档后执行的一个自己的函数.在实际中ht ...
Ruby Rails学习中：有点内容的静态页面
续上篇: 一. 有点内容的静态页面 rails new 命令创建了一个布局文件, 不过现在最好不用.我们重命名这个文件: $ mv app/views/layouts/application.html ...
Lua 截取字符串（截取utf-8格式字符串）
对utf-8完全没概念的可以看看我上一篇随笔:简单说说utf-8编码格式另外,还要知道string.sub 和 string.byte 的用法. 先上完整代码: local StringHelper ...
8-Perl 哈希
1.Perl 哈希哈希是 key/value 对的集合.Perl中哈希变量以百分号 (%) 标记开始.访问哈希元素格式:${key}.以下是一个简单的哈希实例:#!/usr/bin/perl%data ...
html homework27
1. 使用框架完成如下功能将框架先上下分割成两部分(上半部分的为TopFrame).再将下半部分垂直分割为两部分(左侧为BottomLeftFrame,右侧为BottomRightFrame),为T ...
Java基础第二天--多态、接口
多态多态的概述同一个对象,在不同时刻表现出来的不同形态多态的前提和体现有继承/实现关系有方法重写关系有父类引用指向子类对象 public class Animal { public voi ...

抓取腾讯招聘python岗位

抓取腾讯招聘python岗位的更多相关文章

随机推荐

热门专题