教你用python爬虫监控教务系统，查成绩快人一步！

教你用python爬虫监控教务系统，查成绩快人一步！
这几天考了大大小小几门课，教务系统又没有成绩通知功能，为了急切想知道自己挂了多少门，于是我写下这个脚本。

设计思路：
设计思路很简单，首先对已有的成绩进行处理，变为list集合，然后定时爬取教务系统查成绩的页面，对爬取的成绩也处理成list集合，如果newList的长度增加了，就找出增加的部分，并通过邮件通知我。

脚本运行效果：
服务器：

发送邮件通知：

代码如下：

import datetime

import time

from email.header import Header

import requests

import re

import smtplib

from email.mime.text import MIMEText

from bs4 import BeautifulSoup

def listener():

    #在这里我通过模拟登陆的方式登陆

    #一般来说这里填写的是username跟password

    #但我们学校后台将用户名和密码进行了加密

    #通过观察浏览器的请求数据跟页面源码猜出学校后台的加密方式

    data={

        #出于学校安全考虑，这里就不给出加密方式了

        'encoded':'xxxxxxxxxxxxxxxxxxx'

    }

    session = requests.Session()

    session.post('http://jwc.sgu.edu.cn/jsxsd/xk/LoginToXk',data=data)

    #请求2019-2020-1学期的所有成绩

    r_data = {

        'kksj': '2019-2020-1',

        'kcxz': '',

        'kcmc': '',

        'xsfs': 'all'

    }

    r = session.post('http://jwc.sgu.edu.cn/jsxsd/kscj/cjcx_list', data=r_data)

    #对爬回来数据进行封装

    soup = BeautifulSoup(r.text, 'html.parser')

    #返回已有的成绩列表

    oldList = toList(soup)

    max = len(oldList)

    #这里用死循环定时爬取成绩页面分析是否分布新成绩

    while (True):

        #post跟get方式不能乱用，不然数据会出错

        r = session.post('http://jwc.sgu.edu.cn/jsxsd/kscj/cjcx_list',data=r_data)

        soup = BeautifulSoup(r.text, 'lxml')

        #print(soup.prettify())

        length = len(soup.find_all(string=re.compile('2019-2020-1')))-1

        print("course_length: ",length)

        if (r.status_code == 200 and length != 0):

            if (length > max):

                #查询新出的成绩列表

                newlist = toList(soup)

                #获取两个列表不同之处，不同的就是新成绩

                diflist = compareTwoList(oldList, newlist)

                oldList=newlist

                if diflist=='':

                    send("unkowned Error","unkowned Error")

                else:

                    #有新成绩了，发送邮件通知我

                    send('you have new course sorce!!', diflist)

                max = length

            print('last running time was:',datetime.datetime.now())

            #定时作用，500s查一次

            time.sleep(500)

        else:

            # 发送邮件断开连接了 print("had disconnected...")

            send("your server is disconnected!!!","your server is disconnected!!!")

            break

def send(title,msg):

    mail_host = 'smtp.qq.com'

    # 你的qq邮箱名，没有.com

    mail_user = '你的qq邮箱名，没有.com'

    # 密码(部分邮箱为授权码)

    mail_pass = '授权码'

    # 邮件发送方邮箱地址

    sender = '发送方邮箱地址'

    # 邮件接受方邮箱地址，注意需要[]包裹，这意味着你可以写多个邮件地址群发

    receivers = ['yoletpig@qq.com']

    # 设置email信息

    # 邮件内容设置

    message = MIMEText(msg, 'plain', 'utf-8')

    # 邮件主题

    message['Subject'] = Header(title,'utf-8')

    # 发送方信息

    message['From'] = sender

    # 接受方信息

    message['To'] = receivers[0]

    # 登录并发送邮件

    try:

        # smtpObj = smtplib.SMTP()

        # # 连接到服务器

        # smtpObj.connect(mail_host, 25)

        smtpObj = smtplib.SMTP_SSL(mail_host)

        # 登录到服务器

        smtpObj.login(mail_user, mail_pass)

        # 发送

        smtpObj.sendmail(

            sender,receivers,message.as_string())

        # 退出

        smtpObj.quit()

        print('success')

    except smtplib.SMTPException as e:

        print('error', e)  # 打印错误

def toList(soup):

    flag = True

    list = []

    strs = ''

    #对tr标签下的td进行遍历并取值

    for tr in soup.find_all('tr'):

        if flag:

            flag = False;

            continue

        i = 1

        for td in tr.stripped_strings:

            if (i == 1 or i == 2):

                i += 1

                continue

            strs += "_" + td

            i += 1

        list.append(strs)

        strs = ''

    return list

def compareTwoList(oldList,newList):

    diflist=''

    for sub in newList:

        #判断是否唯一

        if(oldList.count(sub)==0):

            diflist = sub

            break

    return diflist

if __name__ == '__main__':

    listener()

这个脚本不出意外的话要运行到我所有成绩出来为止，但我电脑肯定不会这么多天不关机呀，于是我就将这个脚本放到服务器上运行

http://mseo.chinaz.com/lvyous1.nx04.com/ http://seo.chinaz.com/lvyous2.nx04.com/ http://mseo.chinaz.com/lvyous3.nx04.com/ http://seo.chinaz.com/lvyous4.nx04.com/

http://mseo.chinaz.com/lvyous5.nx04.com/ http://seo.chinaz.com/lvyous6.nx04.com/ http://mseo.chinaz.com/lvyous7.nx04.com/ http://seo.chinaz.com/lvyous8.nx04.com/

教你用python爬虫监控教务系统，查成绩快人一步！的更多相关文章

Python爬Boss，找工作，快人一步！！！
通过职位搜索"Python开发",看下搜索的结果: https://www.zhipin.com/job_detail/?query=python开发&city=10102 ...
用Python爬虫爬取广州大学教务系统的成绩（内网访问）
用Python爬虫爬取广州大学教务系统的成绩(内网访问) 在进行爬取前,首先要了解: 1.什么是CSS选择器? 每一条css样式定义由两部分组成,形式如下: [code] 选择器{样式} [/code ...
用python爬虫监控CSDN博客阅读量
作为一个博客新人,对自己博客的访问量也是很在意的,刚好在学python爬虫,所以正好利用一下,写一个python程序来监控博客文章访问量效果代码会自动爬取文章列表,并且获取标题和访问量,写入exc ...
零基础教你写python爬虫
大家都知道python经常被用来做爬虫,用来在互联网上抓取我们需要的信息. 使用Python做爬虫,需要用到一些包: requests urllib BeautifulSoup 等等,关于python ...
在Android上模拟登录广工正方教务系统查询成绩
这是在博客园里开博以来写的第一篇博客. 因为之前看过很多人都有发过关于模拟登录正方软件获取数据的文章,自己觉得挺好玩的便也去动手一做,开始还以为挺难的,但实际做起来还蛮简单的,当然其中还有些小插曲. ...
手把手教你用Python爬虫煎蛋妹纸海量图片
我们的目标是用爬虫来干一件略污事情最近听说煎蛋上有好多可爱的妹子,而且爬虫从妹子图抓起练手最好,毕竟动力大嘛.而且现在网络上的妹子很黄很暴力,一下接受太多容易营养不量,但是本着有人身体就比较好的套路 ...
python爬虫快递查询系统（源码）
import requestsimport json def get_express_type(postid): '''根据快递单号来智能判断快递类型''' url = 'http://www.kua ...
Python 爬虫监控女神的QQ空间新的说说,实现邮箱发送
主要实现的功能就是:监控女神的 QQ空间,一旦女神发布新的说说,你的邮箱马上就会收到说说内容,是不是想了解一下先看看代码运行效果图: PS:只有你有一台云服务器你就可以把程序24h运行起来直接上代 ...
Python 爬虫监控女神的QQ空间新的说说,实现秒赞,并发送说说内容到你的邮箱
这个文章主要是在前一篇文章上新增了说说秒赞的功能前一篇文章可以了解一下那么,这次主要功能就是监控女神的 QQ空间,一旦女神发布新的说说,马上点赞,你的邮箱马上就会收到说说内容,是不是想了解一下 ...

随机推荐

http轮询，长轮询
轮询,长轮询轮询轮询:客户端定时向服务器发送Ajax请求,服务器接到请求后马上返回响应信息并关闭连接. 优点:后端程序编写比较容易. 缺点:请求中有大半是无用,浪费带宽和服务器资源. 实例:适于小 ...
PSR标准规范
PSR标准规范基本代码规范 PHP代码文件必须以不带 BOM 的 UTF-8 编码: 类的命名必须遵循 StudlyCaps 大写开头的驼峰命名规范: 类中的常量所有字母都必须大写,单 ...
Java基于OpenCV实现走迷宫（图片+路线展示）
Java基于OpenCV实现走迷宫(图片+路线展示) 由于疫情,待在家中,太过无聊.同学发了我张迷宫图片,让我走迷宫来缓解暴躁,于是乎就码了一个程序出来.特此记录. 原图: 这张图,由于不是非常清晰, ...
前端url参数中带有callback并产生错误
错误截图: 初步诊断是由于后端返回值的数据格式不正确造成的解决方式: 1).接受在springmvc中接受callback参数 2).将对象转为Object 3).拼接callback方法,其中返回 ...
使用nutz框架，找不到入口函数，访问Url报404
案例今天在跟着nutz框架教程去配置demo时,发现访问URL找不到入口函数,出现了Search mapping for path=/user/count : NOT Action match 异常 ...
人生需要Plan B
天有不测风云,人有祸兮旦福.2020年,刚打开就是地狱模式! 武汉加油,中国加油! 新冠状肺炎的强传播性,让人们不得不乖乖待在家,工地开不了工,白领不能上班,农村封村,城市封小区.人们每天在一个小范围 ...
Hibernate(六)
================================缓存============================定义:介于应用程序和永久性数据存储源之间,可以复制数据存储源中的数据. 工作 ...
自学Java第一章——《Java概述》
1.1 Java历史 Java诞生于SUN(Stanford University Network),09年SUN被Oracle(甲骨文)收购. Java之父是詹姆斯.高斯林(James Goslin ...
tmobst4an
(单选题)HTML代码: <table> <tr><td>Value 1</td><td></td></tr> &l ...
Asp.Net Core Identity 骚断腿的究极魔改实体类
前言默认的 Identity 实体类型在大多数时候已经基本够用,很多时候也只是稍微在 IdentityUser 类中增加一些自定义数据字段,比如头像.这次,我要向园友隆重介绍我魔改之后的 Ident ...

教你用python爬虫监控教务系统，查成绩快人一步！

教你用python爬虫监控教务系统，查成绩快人一步！的更多相关文章

随机推荐

热门专题