python爬取并计算成绩

模拟登录后抓取成绩，计算绩点。

# -*- coding: utf-8 -*-  

import urllib

import urllib2

import cookielib

import re

import string

#绩点运算

class SDU:

   #类的初始化

   def __init__(self):

      #登录URL

      self.loginUrl = 'http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bks_login2.login'

      #成绩URL

      self.gradeUrl = 'http://jwxt.sdu.edu.cn:7890/pls/wwwbks/bkscjcx.curscopre'

      #CookieJar对象

      self.cookies = cookielib.CookieJar()

      #表单数据

      self.postdata = urllib.urlencode({

            'stuid':'',

            'pwd':'xxxxx'

         })

      #构建opener

      self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookies))

      #学分list

      self.credit = []

      #成绩list

      self.grades = []

   def getPage(self):

      req  = urllib2.Request(

            url = self.loginUrl,

            data = self.postdata)

      result = self.opener.open(req)

      result = self.opener.open(self.gradeUrl)

      #返回本学期成绩页面

      return result.read().decode('gbk')

   def getGrades(self):

      #获得本学期成绩页面

      page = self.getPage()

      #正则匹配

      myItems = re.findall('<TR>.*?<p.*?<p.*?<p.*?<p.*?<p.*?>(.*?)</p>.*?<p.*?<p.*?>(.*?)</p>.*?</TR>',page,re.S)

      for item in myItems:

         self.credit.append(item[0].encode('gbk'))

         self.grades.append(item[1].encode('gbk'))

      self.getGrade()

   def getGrade(self):

      #计算总绩点

      sum = 0.0

      weight = 0.0

      for i in range(len(self.credit)):

         if(self.grades[i].isdigit()):

            sum += string.atof(self.credit[i])*string.atof(self.grades[i])

            weight += string.atof(self.credit[i])

      print u"本学期绩点为:",sum/weight

sdu = SDU()

sdu.getGrades()

python爬取并计算成绩的更多相关文章

python爬取网站数据
开学前接了一个任务,内容是从网上爬取特定属性的数据.正好之前学了python,练练手. 编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这个机会算是彻底搞清楚了. 问题要从文字的编码讲 ...
代理IP爬取，计算，发放自动化系统
IoC Python端 MySQL端 PHP端怎么使用这学期有一门课叫<物联网与云计算>,于是我就做了一个大作业,实现的是对代理IP的爬取,计算推荐,发放给用户等任务的的自动化系统.由 ...
萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下:http://www.demodashi.com/demo/11578.html 一.写在前面之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这样 ...
python爬取网站数据保存使用的方法
这篇文章主要介绍了使用Python从网上爬取特定属性数据保存的方法,其中解决了编码问题和如何使用正则匹配数据的方法,详情看下文编码问题因为涉及到中文,所以必然地涉及到了编码的问题,这一次借这 ...
Python爬取豆瓣《复仇者联盟3》评论并生成乖萌的格鲁特
代码地址如下:http://www.demodashi.com/demo/13257.html 1. 需求说明本项目基于Python爬虫,爬取豆瓣电影上关于复仇者联盟3的所有影评,并保存至本地文件. ...
Python 爬取热词并进行分类数据分析-[解释修复+热词引用]
日期:2020.02.02 博客期:141 星期日 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[拓扑 ...
Python爬取《你好李焕英》豆瓣短评并基于SnowNLP做情感分析
爬取过程在这里: Python爬取你好李焕英豆瓣短评并利用stylecloud制作更酷炫的词云图本文基于前文爬取生成的douban.txt,基于SnowNLP做情感分析. 依赖库: 豆瓣镜像比较快: ...
毕设之Python爬取天气数据及可视化分析
写在前面的一些P话:(https://jq.qq.com/?_wv=1027&k=RFkfeU8j) 天气预报我们每天都会关注,我们可以根据未来的天气增减衣物.安排出行,每天的气温.风速风向. ...
Python 爬取所有51VOA网站的Learn a words文本及mp3音频
Python 爬取所有51VOA网站的Learn a words文本及mp3音频 #!/usr/bin/env python # -*- coding: utf-8 -*- #Python 爬取所有5 ...

随机推荐

jquery循环延迟加载,用于在图片加载完成后再加载js
<html> <head> <script type="text/javascript" src="http://lib.sinaapp.c ...
不要告诉我你懂margin
分类: Html/CSS | 转载请注明: 出自海玉的博客本文地址: http://www.hicss.net/do-not-tell-me-you-understand-margin/ 你真的了 ...
linux日志处理logrotate使用
摘录自:http://linux008.blog.51cto.com/2837805/555829 内容在这里做个备份,以便以后查看: 使用logrotate管理nginx日志文件 2011-04- ...
【转】.NET多种WebKit内核/Blink内核浏览器初步测评报告
第1篇:.NET多种WebKit内核/Blink内核浏览器初步测评报告本文转自“吾乐吧软件站”,原文链接:http://www.wuleba.com/?p=23590 报告研究时间:2013-10- ...
JS 阻止浏览器默认行为和冒泡事件
JS 冒泡事件首先讲解一下js中preventDefault和stopPropagation两个方法的区别: preventDefault方法的起什么作用呢?我们知道比如<a href=& ...
python数据类型之list
1.append:增加元素到列表尾部 L.append(object) -> None -- append object to end 2.clear:清空列表中所有元素 3.count:返回列 ...
ajax方法完整的事件流
JavaScript闭包演示
<!DOCTYPE HTML> <html> <head> <meta charset="utf-8" /> <title&g ...
org.pentaho.di.ui.core.widget.PasswordTextVar
package org.pentaho.di.ui.core.widget; import org.eclipse.swt.SWT; import org.eclipse.swt.events.Mod ...
jsoncpp用法通俗易懂之将数据合成json格式
void *upload(void *pParam) { CUpSender *s = (CUpSender*)pParam; map<string, string> mx; char t ...

python爬取并计算成绩

python爬取并计算成绩的更多相关文章

随机推荐

热门专题