python_selenium智联搜索

去招聘会工作，奈何网上仅仅提供招聘会的公司名字，没有提供招聘的职位，SO我写了个小代码给别人在智联上面搜索职位，由于时间紧迫，前程的就不写了

#!/usr/bin/python3.4

# -*- coding: utf-8 -*-

from selenium import webdriver

from lxml import etree

import time

# 打开浏览器

def openbrowser(keyword):

    global browser

    # 打开谷歌浏览器

    # Firefox()

    # Chrome()

    # browser = webdriver.Chrome()

    options = webdriver.ChromeOptions()

    prefs = {

        'profile.default_content_setting_values': {

            'images': 2

        }

    }

    options.add_experimental_option('prefs', prefs)

    browser = webdriver.Chrome(chrome_options=options)

    try:

        browser.find_element_by_id("KeyWord_kw2").send_keys(keyword)

        browser.find_element_by_class_name("doSearch").click()

        time.sleep(5)

        htmlcontent = browser.page_source

        browser.quit()

    except:

        url = "http://www.zhaopin.com/"

        browser.get(url)

        # 打开浏览器时间

        # print("等待10秒打开浏览器...")

        # time.sleep(10)

        browser.find_element_by_id("KeyWord_kw2").send_keys(keyword)

        browser.find_element_by_class_name("doSearch").click()

        time.sleep(5)

        htmlcontent = browser.page_source

        browser.quit()

    return htmlcontent

def analyzehtml(html):

    info = []

    page = etree.HTML(html.lower())

    hrefs = page.xpath('//a[@style="font-weight: bold"]/text()')

    for href in hrefs:

        info.append(href)

    return info

if __name__ == "__main__":

    file = open("../txt/company.txt")

    companys = file.readlines()

    for keyword in companys:

        print(keyword.strip())

        html = openbrowser(keyword.strip())

        a = analyzehtml(html)

        a.insert(0, str(keyword.strip()))

        print(a)

        b = "&&".join(a)

        if len(b)==0:

            b = "智联没有找到该公司"

        filewrite = open("../txt/qwe.txt", "a")

        filewrite.write("\n" + str(b))

        filewrite.close()

python_selenium智联搜索的更多相关文章

用python抓取智联招聘信息并存入excel
用python抓取智联招聘信息并存入excel tags:python 智联招聘导出excel 引言:前一阵子是人们俗称的金三银四,跳槽的小朋友很多,我觉得每个人都应该给自己做一下规划,根据自己的进步 ...
python爬虫实战（五）--------智联招聘网
前些天帮同事爬取一些智联招聘网上的关于数据分析的职位信息,他说要做一些数据分析看看,现在已经帮他爬完了.我本来想用Scrapy来爬的,但是不知道为什么爬取的数据和真实搜到的数据不太一样,比如:搜索到的 ...
Python+selenium爬取智联招聘的职位信息
整个爬虫是基于selenium和Python来运行的,运行需要的包 mysql,matplotlib,selenium 需要安装selenium火狐浏览器驱动,百度的搜寻. 整个爬虫是模块化组织的,不 ...
Java实例——基于jsoup的简单爬虫实现（从智联获取工作信息）
这几天在学习Java解析xml,突然想到Dom能不能解析html,结果试了半天行不通,然后就去查了一些资料,发现很多人都在用Jsoup解析html文件,然后研究了一下,写了一个简单的实例,感觉还有很多 ...
python爬取智联招聘职位信息（单进程）
我们先通过百度搜索智联招聘,进入智联招聘官网,一看,傻眼了,需要登录才能查看招聘信息没办法,用账号登录进去,登录后的网页如下: 输入职位名称点击搜索,显示如下网页: 把这个URL:https://s ...
异构智联Wi-Fi+蓝牙模组，连接快、准、稳！
下班回家打开门,电灯.电视.空调.音响.电动窗帘.扫地机器人--一呼百应,有序开工,原本冰冷的房子立刻变成了温暖港湾.可以说,舒适便捷的智能设备已经完全融入了我们的生活中. 从单一场景.单一设备,到现 ...
智联招聘卓聘IM演进过程
1. 卓聘IM开发背景智联卓聘是智联旗下高端人才招聘平台,成立快4年了,业务增涨每年以100%速度增涨,业务增涨快在开发和上线速度要求也比较高. 2016年6月提出IM开发需求,7月初上线,开发人 ...
智联卓聘卓聘IM(聊聊)开发实践
1. 卓聘IM开发背景智联卓聘是智联旗下高端人才招聘平台,成立快4年多,业务增涨每年以100%速度增涨快,同时对产品和研发速度都比较高. 2015年提出IM开发,主要用于后选人与猎头及时交流,降低 ...
node.js 89行爬虫爬取智联招聘信息
写在前面的话, .......写个P,直接上效果图.附上源码地址 github/lonhon ok,正文开始,先列出用到的和require的东西: node.js,这个是必须的 request,然发 ...

随机推荐

NLog的使用
1.项目添加NLog的项目引用: 2.将工程的framework框架改为3.5或4.0,将配置文件[NLog.config]拷贝至运行的bin/(release/debug)路径下 3.项目中代码使用 ...
cocoapod安装过程中的幺蛾子
cocoapod是GoogleMobileAd framework推荐的一个自动解决依赖关系的工具. 安装cocoapod时遇到问题: EthandeMacBook-Air:Xcode ethan ...
React学习——ListView组件
(草稿) 先把代码放上来,再补充说明 <!DOCTYPE html> <html> <head> <title>React ListView</t ...
关于jetty项目中的问题.
在某台虚拟机上部署的项目出现的问题: 我想要更改定义的owl文件,重启服务器,却打不开网页. 1.couldnot found owl ,然后我拷贝一份owl到work/config目录下,继续更改配 ...
GGXX的卡通渲染实现真的好变态......
最近在youtube上看了GDC,学了很多东西,最让我震撼的就是ggxx的卡通渲染了.感慨一下,想要用3D做出二次元的效果,真的不容易.现记录一些要点: 1)不要使用normal map来做cel-s ...
NOIP 考前计算几何练习
BZOJ 1580 直接解析算出每段的时间然后模拟即可 #include <iostream> #include <cstdio> #include <cstring&g ...
【Python】使用正则表达式实现计算器练习
已知有以下这样一个不太友好的公式: 1 - 2 * ( (60-30 +(-9-2-5-2*3-5/3-40*4/2-3/5+6*3) * (-9-2-5-2*5/3 + 7 /3*99/4*2998 ...
关于 jsp 解析特殊字符的问题
在项目中了使用了一个UI封装好的插件经测试了可以返回一些特殊字符,但是因为是特殊字符,导致了jsp解析出错,使用了Jquery来添加了dom结构,添加完之后,Ui控件进行初始化的时候报错了,原因 ...
MySQL - MySQL++在c++11环境下接口设计
安装官方提供的mysqlconnect后,可以使用mysql++库,在官方的C API上再次做一个c++面向对象封装. 这里mysql++的安装依赖于mysql-connector-c.安装参考:ht ...
Spring面向切面之AOP深入探讨
Spring之AOP深入探讨刚接触AOP之前我已经找了网上各种博客论坛上的关于AOP的文章利于我理解因为听好多人说AOP很复杂,很深奥当我接触之后发现根本不是那么的难于理解.它只是一个基于OOP技术 ...

python_selenium智联搜索

python_selenium智联搜索

python_selenium智联搜索的更多相关文章

随机推荐

热门专题