Java模拟登录带验证码的教务系统(原理详解)
一:原理
- 客户端访问服务器,服务器通过Session对象记录会话,服务器可以指定一个唯一的session ID作为cookie来代表每个客户端,用来识别这个客户端接下来的请求。
- 我们通过Chrome浏览器进行网页访问时,服务器会在我们第一次请求时就建立会话生成Session对象,然后给我们的浏览器返回该Session ID,并把Session的ID保存在客户机的Cookie中,如图:
- 我们的每次请求都带上我们的Cookie,就可以实现会话状态的保持。
二:代码
- Jsoup应该是Java最简单的网页解析框架
- 下载地址:https://jsoup.org/download
- 该实例以强智教务系统为例:http://jwxt.qlu.edu.cn
package cn.zyzpp.eduCookie;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
import java.util.Scanner;
import org.jsoup.Connection;
import org.jsoup.Connection.Method;
import org.jsoup.Connection.Response;
import org.jsoup.Jsoup;
import org.junit.Before;
import org.junit.Test;
import cn.zyzpp.eduCookie2.S;
/**
* 模拟登录带验证码的教务系统
*
* 2018-2-9
*/
public class JsoupSafeCode {
private String url_safecode = "http://jwxt.qlu.edu.cn/verifycode.servlet?t=0.020974584"; // 验证码
private String url_encode = "http://jwxt.qlu.edu.cn/Logon.do?method=logon&flag=sess"; // 加密字符串
private String url_Login = "http://jwxt.qlu.edu.cn/Logon.do?method=logon"; // 登录
private String username = "";
private String password = "";
private String path = JsoupSafeCode.class.getResource("/").getPath().replaceAll("%20", " ") + "safecode.png";
private Map<String, String> cookie;
/**
* 下载验证码
* 保存Cookie
* @throws IOException
*/
public void getSafeCode() throws IOException {
Response response = Jsoup.connect(url_safecode).ignoreContentType(true) // 获取图片需设置忽略内容类型
.userAgent("Mozilla").method(Method.GET).timeout(3000).execute();
cookie = response.cookies();
byte[] bytes = response.bodyAsBytes();
Util.saveFile(path, bytes);
System.out.println("保存验证码到:" + path);
}
/**
* 登录教务系统
*/
public void initLogin() throws IOException {
S.print("输入验证码:");
Scanner scan = new Scanner(System.in);
String code = scan.next();
try {
Map<String, String> data = new HashMap<String, String>();
data.put("view", "1");
data.put("encoded", getEncoded());
data.put("RANDOMCODE", code);
Connection connect = Jsoup.connect(url_Login)
.header("Accept",
"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8")
.userAgent("Mozilla").method(Method.POST).data(data).timeout(3000);
for (Map.Entry<String, String> entry : cookie.entrySet()) {
connect.cookie(entry.getKey(), entry.getValue());
}
Response response = connect.execute();
S.println(response.parse().text().toString());
} catch (IOException e) {
}
}
/**
* 加密参数(依具体环境而定,加密算法一般在JS中获得)
*/
public String getEncoded() {
try {
Connection connect = Jsoup.connect(url_encode)
.header("Accept",
"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8")
.userAgent("Mozilla").method(Method.POST).timeout(3000);
for (Map.Entry<String, String> entry : cookie.entrySet()) {
connect.cookie(entry.getKey(), entry.getValue());
}
Response response = connect.execute();
String dataStr = response.parse().text();
// 把JS中的加密算法用Java写一遍:
String scode = dataStr.split("#")[0];
String sxh = dataStr.split("#")[1];
String code = username + "%%%" + password;
String encoded = "";
for (int i = 0; i < code.length(); i++) {
if (i < 20) {
encoded = encoded + code.substring(i, i + 1)
+ scode.substring(0, Integer.parseInt(sxh.substring(i, i + 1)));
scode = scode.substring(Integer.parseInt(sxh.substring(i, i + 1)), scode.length());
} else {
encoded = encoded + code.substring(i, code.length());
i = code.length();
}
}
return encoded;
} catch (IOException e) {
}
return null;
}
}
package cn.zyzpp.eduCookie;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
public class Util {
/**
* 将字节流转换成文件
*
* @param filename
* @param data
* @throws Exception
*/
public static void saveFile(String filename, byte[] data) {
if (data != null) {
String filepath = filename;
File file = new File(filepath);
if (file.exists()) {
file.delete();
}
try {
FileOutputStream fos = new FileOutputStream(file);
fos.write(data, 0, data.length);
fos.flush();
fos.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}
后记
在模拟登陆该教务系统时,笔者观察到该教务系统还有一个不需要验证码即可登陆的网址:http://jwxt.qlu.edu.cn/jsxsd/xsxk/xklc_list,不过这个需要把用户名和密码通过JS算法进行前端加密合成为encoded字符串,如下
String encoded = playJs(username) + "%%%" + playJs(password);
然后直接带参POST即可。
具体的playJs()方法参考我的另一篇博客:Java执行JavaScript脚本破解encodeInp()加密
Java模拟登录带验证码的教务系统(原理详解)的更多相关文章
- php使用curl模拟登录带验证码的网站[开发篇]
需求是这样的,需要登录带验证码的网站,获取数据,但是不可能人为一直去记录数据,想通过自动采集的方式进行,如下是试验出来的结果代码!有需要的可以参考下! <?php namespace Home\ ...
- php使用curl模拟登录带验证码的网站
需求是这样的,需要登录带验证码的网站,获取数据,但是不可能人为一直去记录数据,想通过自动采集的方式进行,如下是试验出来的结果代码!有需要的可以参考下! <?php namespace Home\ ...
- 在Android上模拟登录广工正方教务系统查询成绩
这是在博客园里开博以来写的第一篇博客. 因为之前看过很多人都有发过关于模拟登录正方软件获取数据的文章,自己觉得挺好玩的便也去动手一做,开始还以为挺难的,但实际做起来还蛮简单的,当然其中还有些小插曲. ...
- Python爬虫模拟登录带验证码网站
问题分析: 1.爬取网站时经常会遇到需要登录的问题,这是就需要用到模拟登录的相关方法.python提供了强大的url库,想做到这个并不难.这里以登录学校教务系统为例,做一个简单的例子. 2.首先得明白 ...
- HttpURLConnection模拟登录学校的正方教务系统
教务系统登录界面 如图1-1 1-1 F12-->network查看登录教务系统需要参数: __VIEWSTAT txtUserName TextBox2 txtSecretCode Radio ...
- Java面试必问通信框架NIO,原理详解
NIO 流与块 通道与缓冲区 缓冲区状态变量 文件 NIO 实例 选择器 套接字 NIO 实例 内存映射文件 NIO与IO对比 Path Files NIO 新的输入/输出 (NIO) 库是在 JDK ...
- 【Java】【JVM】Sychronized底层加锁原理详解
我们首先先看看JMM模型,话不多说,上图: JMM对应的8大原子操作: read(读取):从主内存读取数据 load(载入):将主内存读取到的数据写入工作内存 use(使用):从工作内存读取数据来计算 ...
- Java模拟登录系统抓取内容【转载】
没有看考勤的习惯,导致我的一天班白上了,都是钱啊,系统也不发个邮件通知下.... 为了避免以后还有类似状况特别写了个java模拟登录抓取考勤内容的方法(部分代码来自网络),希望有人修改后也可以 ...
- [PHP自动化-进阶]002.CURL模拟登录带有验证码的网站
引言:继前文<模拟登录并采集数据>,大家似乎看不过瘾,这会再出一发,模拟实现带验证码网站的登录. 这篇文章主要介绍了PHP使用CURL实现对带有验证码的网站进行模拟登录的方法,可以帮助读者 ...
随机推荐
- Docker的安装与使用介绍
docker是什么? Docker 是一个开源的应用容器引擎,基于 Go 语言 并遵从Apache2.0协议开源. Docker 可以让开发者打包他们的应用以及依赖包到一个轻量级.可移植的容器中,然后 ...
- Apache Windows下Apache安装步骤
1.apache官网下载Apache HTTP Server服务器 我相信有些朋友刚用apache服务器时,都希望从官网上下载,而面对着官网上众多的项目和镜像以及目录,也许有点茫然.下面是具体步骤: ...
- 应用生命周期终极 DevOps 工具包
[编者按]本文作者为 Kevin Goldberg,主要介绍了在开发.运营应用的完整生命周期当中,可能用到的 DevOps 工具大集合.文章系 OneAPM 工程师编译整理. DevOps工具包中合适 ...
- spark大批量读取Hbase时出现java.lang.OutOfMemoryError: unable to create new native thread
这个问题我去网上搜索了一下,发现了很多的解决方案都是增加的nproc数量,即用户最大线程数的数量,但我修改了并没有解决问题,最终是通过修改hadoop集群的最大线程数解决问题的. 并且网络上的回答多数 ...
- Oracle EBS 查看执行计划
explain plan forSELECT MMT.TRANSACTION_ID,GIR.JE_HEADER_ID,GIR.JE_LINE_NUMFROM GL_IMPORT_REFERENCE ...
- Scrapy(爬虫框架)中,Spider类中parse()方法的工作机制
parse(self,response):当请求url返回网页没有指定回调函数,默认的Request对象的回调函数,用来处理网页返回的response,和生成的Item或者Request对象 以下分析 ...
- NPOI 笔记
前言 文档:http://npoi.codeplex.com/documentation 示例:https://npoi.svn.codeplex.com/svn/ 下载:https://www.nu ...
- Kali 2.0 下 Metasploit 初始化配置
在kali 2.0中,命令行中直接输入msfconsole 提示不能连接到数据库 ,是由于postgresql 未启动.因此,需要开启postgresql,并且进行postgresql 的初始化配置. ...
- LeetCode算法题-Intersection of Two Arrays II(Java实现)
这是悦乐书的第208次更新,第220篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第76题(顺位题号是350).给定两个数组,编写一个函数来计算它们的交集.例如: 输入: ...
- Linux 小知识翻译 - 「LDAP」
这次聊聊「LDAP」. LDAP是「Lightweight Directory Access Protocol」的所有,从名字上可以看出是协议的一种. LDAP是访问数据库(层次型数据库)的组件.管理 ...