python 定时爬取内容并发送报告到指定邮箱

import requests

import smtplib

import schedule

import time

from bs4 import BeautifulSoup

from email.mime.text import MIMEText

from email.header import Header

account = input('请输入你的邮箱：')

password = input('请输入你的密码：')

receiver = input('请输入收件人的邮箱：')

def weather_spider():

    res_foods = requests.get('http://www.xiachufang.com/explore/')

    bs_foods = BeautifulSoup(res_foods.text,'html.parser')

    list_foods = bs_foods.find_all('div',class_='info pure-u')

    list_all = []

    for food in list_foods:

        tag_a = food.find('a')

        name = tag_a.text[17:-13]

        # URL = 'http://www.xiachufang.com'+tag_a['href']

        # tag_p = food.find('p',class_='ing ellipsis')

        # ingredients = tag_p.text[1:-1]

        list_all.append(name)

    return list_all

def send_email(content):

    mailhost='smtp.qq.com'

    qqmail = smtplib.SMTP()

    qqmail.connect(mailhost,25)

    qqmail.login(account,password)

    content= " ".join(content)

    message = MIMEText(content, 'plain', 'utf-8')

    subject = '今日菜谱'

    message['Subject'] = Header(subject, 'utf-8')

    try:

        qqmail.sendmail(account, receiver, message.as_string())

        print ('邮件发送成功')

    except:

        print ('邮件发送失败')

    qqmail.quit()

def job():

    print('开始一次任务')

    con = weather_spider()

    send_email(con)

    print('任务完成')

schedule.every().day.at("19:12").do(job)

while True:

    schedule.run_pending()

    time.sleep(1)

python 定时爬取内容并发送报告到指定邮箱的更多相关文章

python爬虫爬取内容中，-xa0，-u3000的含义
python爬虫爬取内容中,-xa0,-u3000的含义 - CSDN博客 https://blog.csdn.net/aiwuzhi12/article/details/54866310
python 爬虫爬取内容时， \xa0 、 \u3000 的含义
最近用 scrapy 爬某网站,发现拿到的内容里面含有 \xa0 . \u3000 这样的字符,起初还以为是编码不对,搜了一下才知道是见识太少 233 . \xa0 是不间断空白符我们通常所用的 ...
用Python定时爬取网站最新资源
记录一下. 写做个网站,爬了另一个网站的内容来做自己网站的内容. 把脚本挂到服务器,每隔一个小时去爬一次资源,然后保存到一个HTML文件里. 用flask做web对接,当有请求的时候就返回那个HTML ...
python爬虫之爬取糗事百科并将爬取内容保存至Excel中
本篇博文为使用python爬虫爬取糗事百科content并将爬取内容存入excel中保存·. 实验环境:Windows10 代码编辑工具:pycharm 使用selenium(自动化测试工具)+p ...
python爬虫——爬取网页数据和解析数据
1.网络爬虫的基本概念网络爬虫(又称网络蜘蛛,机器人),就是模拟客户端发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序.只要浏览器能够做的事情,原则上,爬虫都能够做到. 2 ...
nodejs实现定时爬取微博热搜
The summer is coming " 我知道,那些夏天,就像青春一样回不来. - 宋冬野青春是回不来了,倒是要准备渡过在西安的第三个夏天了. 废话我发现,自己对 coding 这 ...
用Python爬虫爬取广州大学教务系统的成绩（内网访问）
用Python爬虫爬取广州大学教务系统的成绩(内网访问) 在进行爬取前,首先要了解: 1.什么是CSS选择器? 每一条css样式定义由两部分组成,形式如下: [code] 选择器{样式} [/code ...
使用Python爬虫爬取网络美女图片
代码地址如下:http://www.demodashi.com/demo/13500.html 准备工作安装python3.6 略安装requests库(用于请求静态页面) pip install ...
Python爬虫爬取全书网小说，程序源码+程序详细分析
Python爬虫爬取全书网小说教程第一步:打开谷歌浏览器,搜索全书网,然后再点击你想下载的小说,进入图一页面后点击F12选择Network,如果没有内容按F5刷新一下点击Network之后出现如下 ...

随机推荐

CF1208D
CF1208D 题意: 给你一个数组,要求支持单点修改和单点查询解法: 直接线段树搞一搞就没了. CODE: #include<iostream> #include<cstdio& ...
csp-s模拟测试112 & csp-s模拟测试113
考前两天模拟. Day1直接炸飞,T1浪费的时间太长,对拍+调试了一个多小时但复杂度还不能过,最后5分钟想出来了解决方案但是已经打不出来了.T2读入出了事故RE0.T3打了假贪心. Day2心态几乎也 ...
Java排序之计数排序
Java排序之计数排序计数排序思路计数排序适用于有明确范围的数组,比如给定一个数组,且知道所有值得范围是[m,n].这个时候可以使用一个n-m+1长度的数组,待排序的数组就可以散在这个数组上,数组 ...
vue js select下拉框
<template> <ul id="select"> <li> <div class="select-head"&g ...
jmeter连接oracle数据库
== 下载及添加这个文件到这个路径下连接设置: 测试连接链接: https://pan.baidu.com/s/1W0YcVf4VLdsjnxv5umKngQ 提取码: np7j
postgreSQL 之 Privilege & grant & revoke（未完待续）
When an object is created, it is assigned an owner. The owner is normally the role that executed the ...
Apache实现一台服务器上运行多个网站
总共有三种方法:通过不同的IP地址通过不同的域名通过不同的端口号 (1).通过不同的IP地址实现例如一台CentOS7有两个IP:192.168.5.101和192.168.5.103 [roo ...
ubuntu默认root密码问题,第一次使用ubuntu需要设置root密码
http://www.voidcn.com/article/p-yvnoogkc-ng.html 新接触ubuntu(baseondebian)的人,大多会因为安装中没有提示root密码而不太清楚为什 ...
基于LSTM + keras 的诗歌生成器
最近在github 上发现了一个好玩的项目,一个基于LSTM + keras 实现的诗歌生成器,地址是:https://github.com/youyuge34/Poems_generator ...
【AMAD】django-compressor -- 将JS和CSS文件压缩为一个缓存文件
简介个人评分简介 django-compressor1的example: {% load compress %} {% compress css %} <link rel="sty ...

python 定时爬取内容并发送报告到指定邮箱

python 定时爬取内容并发送报告到指定邮箱的更多相关文章

随机推荐

热门专题