前面一篇文章主要讲述,如何通过Python爬取招聘信息,且爬取的日期为前一天的,同时将爬取的内容保存到数据库中;这篇文章主要讲述如何将python文件压缩成exe可执行文件,供后面的操作。
  
  这系列文章主要是最近研究了数据库的定时计划备份,联系爬虫简单做的一个实验,但方法可以,尤其在Windows xp年代。整个系列主要分为五部分,共五篇文章:
  
  1.Python爬取招聘信息,并且存储到MySQL数据库中;
  
  2.调用pyinstaller包将py文件打包成exe可执行文件;
  
  3.设置Windows系统的计划,制作定时任务,每天早上定时执行exe爬虫;
  
  4.结合PHP(因毕业设计指导学生的是PHP系统)简单实现前端招聘信息界面;
  
  5.补充知识:Python调用短信猫发送招聘短信到客户手机。
  
  文章比较基础,希望对您有所帮助,如果文章中存在错误或不足之处。
  
  一. 安装pyinstaller
  
  Py文件通常需要运行在Python编程坏境中,而可执行exe文件更方便,尤其是我们第三篇文章制作定时任务 时,执行exe文件更加方便。
  
  而python将py文件打包成exe可执行文件的方法通常包括两个:pyInstaller和py2exe。这篇文章主要是讲述如何安装pyinstaller包及其打包操作。
  
  你可以再Github中下载进行安装,参考下面"哈士奇说喵"的文章。
  
  下载地址:https://github.com/pyinstaller/pyinstaller/
  
  这篇文章主要介绍pip进行安装的方法,步骤如下:
  
  1.打开cmd,然后去到Python的Scripts文件夹下,如下图所示。
  
  输入安装命令:pip install pyinstaller
  
  2.安装过程如下图所示,调用pip指令安装会进行自动下载及匹配。
  
  3.安装成功后,会在Python/Scripts文件夹下显示该包。
  
  参考文章:关于python打包成exe的一点经验之谈 - ChenJian
  
  将自己的python程序打包成exe - 哈士奇说喵
  
  [Python] 项目打包:5步将py www.sb45475.com 文件打包exe文件 - ccccshq
  
  二. 简单实现exe打包
  
  安装成功pyinstaller扩展包后,需要对文件进行打包操作 。
  
  假设存在一个test01.py文件,功能是打开百度网页,代码如下:
  
  [python] view plain copy
  
  from selenium import webdriver
  
  from selenium.webdriver.common.keys import Keys
  
  import time
  
  driver = webdriver.Firefox()
  
  driver.get("http://www.baidu.com/")
  
  我们将该test01.py文件放到Python安装路径的Scripts下,我的路径如下:
  
  C:\Software\Program Software\Python\Scripts
  
  注意Scripts放置Python的各种第三方扩展包,这里的pyinstaller.exe在此处。
  
  现在需要打包exe程序,步骤:
  
  1.在cmd环境进入该Scripts文件夹路径下;
  
  2.输入指令打包:pyinstaller www.xuancai88c.cn/ - F test01.py
  
  之后你的命令窗(黑框)会运行该代码,并进行打包,运行过程如下图所示。
  
  打包好会在Scripts路径下生成两个文件夹:dist和build,如下图所示。
  
  然后,可执行exe文件在dist文件夹下,如下图所示。
  
  双击该test01.exe,会自动弹出Firefox浏览器,然后访问百度。
  
  更多参数如下图所示:
  
  三. 定时爬虫打包exe文件
  
  下面用同样的方法打包前一篇文章写的定时爬虫代码。步骤如下:
  
  1.将test_zl.py (智联)文件放置Scripts文件夹,与pyinstaller.exe一起。
  
  2.打开cmd,去到Scripts文件夹下。
  
  执行命令: pyinstaller -F test_zl.py
  
  3.生成文件在当前目录下,包括b http://www.wmyl88.com uild和dist文件夹。
  
  4.执行test_zl.exe文件,运行如下图所示。
  
  5.同时数据库如下,可以看到4月23日的招聘信息被爬取成功。
  
  后面还将继续探寻、继续写文,写完这种单击版的定时发送功能,后面研究Python服务器的相关功能。
  
  风雪交加雨婆娑,
  
  琴瑟和鸣泪斑驳。
  
  披星戴月辗转梦,
  
  娜璋白首爱连绵。
  
  最后希望文章对你有所帮助,如果文章中存在错误或不足之处,还请海涵~

Python爬取招聘信息,并且存储到MySQL数据库中的更多相关文章

  1. python爬取网页数据并存储到mysql数据库

    #python 3.5 from urllib.request import urlopen from urllib.request import urlretrieve from bs4 impor ...

  2. 使用HtmlAgilityPack爬取网站信息并存储到mysql

    前言:打算做一个药材价格查询的功能,但刚开始一点数据都没有靠自己找信息录入的话很麻烦的,所以只有先到其它网站抓取存到数据库再开始做这个了. HtmlAgilityPack在c#里应该很多人用吧,简单又 ...

  3. Python爬取网页信息

    Python爬取网页信息的步骤 以爬取英文名字网站(https://nameberry.com/)中每个名字的评论内容,包括英文名,用户名,评论的时间和评论的内容为例. 1.确认网址 在浏览器中输入初 ...

  4. python爬取酒店信息练习

    爬取酒店信息,首先知道要用到那些库.本次使用request库区获取网页,使用bs4来解析网页,使用selenium来进行模拟浏览. 本次要爬取的美团网的蚌埠酒店信息及其评价.爬取的网址为“http:/ ...

  5. Python网络爬虫案例(二)——爬取招聘信息网站

    利用Python,爬取 51job 上面有关于 IT行业 的招聘信息 版权声明:未经博主授权,内容严禁分享转载 案例代码: # __author : "J" # date : 20 ...

  6. Python爬取招聘网站数据,给学习、求职一点参考

    1.项目背景 随着科技的飞速发展,数据呈现爆发式的增长,任何人都摆脱不了与数据打交道,社会对于“数据”方面的人才需求也在不断增大.因此了解当下企业究竟需要招聘什么样的人才?需要什么样的技能?不管是对于 ...

  7. (转)python爬取拉勾网信息

    学习Python也有一段时间了,各种理论知识大体上也算略知一二了,今天就进入实战演练:通过Python来编写一个拉勾网薪资调查的小爬虫. 第一步:分析网站的请求过程 我们在查看拉勾网上的招聘信息的时候 ...

  8. 8月份Python招聘情况怎么样?Python爬取招聘数据,并进行分析

    前言 拉勾招聘是专业的互联网求职招聘平台.致力于提供真实可靠的互联网招聘求职找工作信息.今天我们一起使用 python 采集拉钩的 python 招聘信息,分析一下找到高薪工作需要掌握哪些技术 开发环 ...

  9. python爬取招聘网站数据

    # -*- coding: utf-8 -*- # 爬虫分析 from bs4 import BeautifulSoup from lxml import etree from selenium im ...

随机推荐

  1. Java面向对象-对象的多态性

    Java面向对象-对象的多态性 Java中的多态性表现: 1,方法的重载和重写(覆盖): 2,可以用父类的引用指向子类的具体实现,而且可以随时更换为其他子类的具体实现: 我们先搞个父类Animal: ...

  2. 什么是jsonp?——使用jsonp解决跨域请求问题

    我们在使用ajax请求的时候经常会产生跨域问题,这是由于浏览器的同源策略导致的.所谓同源,即域名.协议.端口均相同,否则不管是静态页面还是动态网页或者web服务都无法通过ajax正常请求.有时候,我们 ...

  3. linux rz -e

    linux shell rz和sz是终端下常用的文件传输命令,rz和sz通过shell被调用,其中rz用于从启用终端的系统上传文件到目标系统(终端登录的目标系统), 这里不过多介绍这些命令,只是记录一 ...

  4. itemize,enumerate,description 用法【LaTeX 使用】

    itemize和enumerate还有description 是LaTeX里列举的三种样式,分别讲一些使用技巧.itemize(意为分条目):\begin{itemize}\item[*] a\ite ...

  5. HttpRuntime自定义定时更新缓存

    缓存更新类如下: /// <summary> /// 缓存更新类 /// </summary> /// <typeparam name="T"> ...

  6. Python基本数据类型--列表、元组、字典、集合

    一.Python基本数据类型--列表(List) 1.定义:[ ]内以逗号分隔,按照索引,存放各种数据类型,每个位置代表一个元素. 2.列表的创建: # 方式一 list1 = ['name','ag ...

  7. java基础之多线程五:实现Runnable的原理

    实现Runnable接口的原理. 背景: 多线程的第一种实现方式是::继承Thread类, 因为我们自定义的类(MyThread)是Thread类的子类, 所以MyThread类的对象调用start( ...

  8. python子进程模块subprocess详解与应用实例 之一

    subprocess--子进程管理器 一.subprocess 模块简介 subprocess最早是在2.4版本中引入的. subprocess模块用来生成子进程,并可以通过管道连接它们的输入/输出/ ...

  9. PHP 商城无限极分类

    无限极分类,用的是递归,在外部调用fen()方法即可 index是刚开始寻找的顶级分类,suo是为了在前端展示的时候缩进 ,$suo=){ 一个数组用来返回的 $t=[]; 这是查询数据库的所有内容 ...

  10. linux 软链接 硬链接

    查看文件sun.txt   加上参数i 是显示节点 inode [root@bogon test]# ls -li sun.txt 10006225 -rw-r--r--. 1 root root 0 ...