Python 爬虫招聘信息并存入数据库

新学习了selenium,啪一下腾讯招聘

 from lxml import etree

 from selenium import webdriver

 import pymysql

 def Geturl(fullurl):#获取每个招聘网页的链接

     browser.get(fullurl)

     shouye_html_text = browser.page_source

     shouye_ele = etree.HTML(shouye_html_text)

     zp_list = shouye_ele.xpath('//*[@id="position"]/div[1]/table/tbody/tr/td/a/@href')#链接url

     zp_url_list  = []

     for zp_url_lost in zp_list:

         zp_url  = 'https://hr.tencent.com/'+zp_url_lost

         zp_url_list.append(zp_url)

     return zp_url_list

 def Getinfo(zp_url_list):#获取每个招聘链接内部的内容

     for zp_url in zp_url_list:

         browser.get(zp_url)

         zp_info_html = browser.page_source

         zp_ele = etree.HTML(zp_info_html)

         zp_info_title = str(zp_ele.xpath('//*[@id="sharetitle"]/text()')[0])

         zp_info_location = str(zp_ele.xpath('//*[@id="position_detail"]/div/table/tbody/tr[2]/td[1]/text()')[0])

         zp_info_type = str(zp_ele.xpath('//*[@id="position_detail"]/div/table/tbody/tr[2]/td[2]/text()')[0])

         zp_info_num = str(zp_ele.xpath('//*[@id="position_detail"]/div/table/tbody/tr[2]/td[3]/text()')[0])

         zp_info_need = str(zp_ele.xpath('//*[@id="position_detail"]/div/table/tbody/tr[3]/td/ul/li/text()'))

         connection = pymysql.connect(host='localhost', user='root', password='', db='txzp', )

         try:

             with connection.cursor() as cursor:

                 sql = "INSERT INTO `txzp_info` (`title`, `location`,`type`,`num`,`need`) VALUES (%s,%s,%s,%s, %s)"

                 cursor.execute(sql, (zp_info_title,zp_info_location,zp_info_type,zp_info_num,zp_info_need))

             connection.commit()

         finally:

             connection.close()

         print(zp_info_title,zp_info_location,zp_info_type,zp_info_num,zp_info_need)

 if __name__ == '__main__':

     browser = webdriver.Chrome()

     pags = int(input('需要几页?'))

     for i in range(0,pags):

         url = 'https://hr.tencent.com/position.php?keywords=&tid=0&start={}'

         fullurl = url.format(str(i*10))

         zp_url_list = Geturl(fullurl)

         Getinfo(zp_url_list)

     browser.close()

Python 爬虫招聘信息并存入数据库的更多相关文章

用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
Python爬取热搜存入数据库并且还能定时发送邮件！！！
一.前言微博热搜榜每天都会更新一些新鲜事,但是自己处于各种原因,肯定不能时刻关注着微博,为了与时代接轨,接受最新资讯,就寻思着用Python写个定时爬取微博热搜的并且发送QQ邮件的程序,这样每天可以 ...
python爬虫爬取ip记录网站信息并存入数据库
import requests import re import pymysql #10页仔细观察路由 db = pymysql.connect("localhost",&quo ...
python之scrapy爬取jingdong招聘信息到mysql数据库
1.创建工程 scrapy startproject jd 2.创建项目 scrapy genspider jingdong 3.安装pymysql pip install pymysql 4.set ...
Python爬取前程无忧网站上python的招聘信息
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 我姓刘却留不住你的心 PS:如有需要Python学习资料的小伙伴可以 ...
爬取前程无忧网站上python的招聘信息。
本文获取的字段有为职位名称,公司名称,公司地点,薪资,发布时间创建爬虫项目 scrapy startproject qianchengwuyou cd qianchengwuyou scrapy g ...
爬虫获取邮箱，存入数据库，发送邮件java Mail
在网页上获取邮箱: package com.my.test; import java.io.BufferedReader; import java.io.InputStreamReader; impo ...
python爬虫：爬取医药数据库drugbank
这个是帮朋友做的,难点就是他们有一个反爬虫机制,用request一直不行,后面我就用selenium直接把网页copy下来,然后再来解析本地的html文件,就木有问题啦. 现在看来,写得有点傻,多包涵 ...
C#获取网页信息并存入数据库
1,获取以及商品分类信息给一网页获取网页上商品信息的分类 using Skay.WebBot; using System; using System.Collections.Generic; usi ...

随机推荐

iptables:no config file
防火墙规则默认都是在/etc/sysconfig/iptables这个文件中的出现这个问题,是因为在/etc/sysconfig/目录下没有找到iptables这个文件可以使用service ip ...
python 生成器&迭代器
列表生成式要生成[1x1, 2x2, 3x3, ..., 10x10]>>> [x * x for x in range(1, 11)]for循环后面还可以加上if判断>&g ...
Oracle 12C pluggable database自启动
实验环境创建了两个PDB,本实验实现在开启数据库时,实现pluggable database PDB2自启动: 原始环境: SQL> shu immediateDatabase closed.D ...
python3.6安装总结
安装Python 3.6 过程中出现了一些问题,导致费时费力.因此把自己安装过程中出现的问题写出来,以备大家查看. 第一步:比较简单的一种安装方法是直接安装Anacanda3 python即可,这时可 ...
使用简单的Java代码在SAP C4C里创建销售订单
需要创建的销售订单的明细通过硬编码指定: 比如销售订单的描述为Jerry Test 2019-1-23 16:05PM 执行之后,看到Status Code 201,说明创建成功: 到UI上能看到成功 ...
Python中返回SQL字段名
def ReturnInfo(self, avalue, akey): cursor = connection.cursor() if type(avalue) == int: Sql = " ...
关于mvvm：UI、数据、绑定、状态、中间变量、数据适配、数据处理
绑定: UI控件 --> VM VM -> UI控件关于mvvm:UI.数据.绑定.状态.中间变量.数据适配.数据处理: https://github.com/zzf073/Log ...
ASP.NET Web API编程——使用Odata
路由配置 routePrefix路由前缀,必须含有Odata字符串,否则路由不到Odata控制器. V1表示版本,可以使用这种方式进行版本控制,也可以使用其他方式. config.Count().Fi ...
如何查看Windows下端口占用情况
开始---->运行---->cmd,或者是window+R组合键,调出命令窗口输入命令:netstat -ano,列出所有端口的情况.在列表中我们观察被占用的端口,比如是49157,首 ...
不推荐在iOS的浏览器应用上使用click和mouseover
iOS上的Safari也支持click 和mouseover等传统的交互事件,只是不推荐在iOS的浏览器应用上使用click和mouseover,因为这两个事件是为了支持鼠标点击而设计出来的.Cli ...

Python 爬虫 招聘信息并存入数据库

Python 爬虫 招聘信息并存入数据库的更多相关文章

随机推荐

热门专题

Python 爬虫招聘信息并存入数据库

Python 爬虫招聘信息并存入数据库的更多相关文章