破解网站码验证,Java实现,不调用任何平台api接口
package image.images; import java.io.File;
import java.io.IOException;
import java.io.InputStream; import org.apache.commons.io.FileUtils;
import org.apache.http.HttpEntity;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
/**
* 负责爬去验证码图片
* @author FMm
*
*/
public class HttpClientImage { public static void main(String[] args) throws ClientProtocolException, IOException, InterruptedException {
// 创建httpClient实例
CloseableHttpClient httpClient = HttpClients.createDefault();
// url
String url = "http://con.monyun.cn:9960/aut_checkCode.hts?iden=1422083454409442236&t=0.06292891333169814";
// 循环爬去20张验证码
for (int i = 0; i < 20; i++) {
// 休眠一下否则图片加载不出来,
Thread.sleep(2000);
// 创建请求
HttpGet httpGet = new HttpGet(url);
// 执行请求
CloseableHttpResponse response = httpClient.execute(httpGet);
// 获取实体对象
HttpEntity httpEntity = response.getEntity();
if (httpEntity != null) {
// 打印返回类型保证是图片类型
System.out.println("Content-Type:" + httpEntity.getContentType().getValue());
// 获取InputStream流
InputStream inputStream = httpEntity.getContent();
// 文件复制,common io 包下,需要 引入依赖
FileUtils.copyToFile(inputStream, new File("/Users/mac/Desktop/image/" + i + ".png"));
}
}
httpClient.close();
}
}
package image.images; import java.awt.Color;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.FileFilter;
import java.io.IOException;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List; import javax.imageio.ImageIO;
import javax.imageio.ImageWriter;
import javax.imageio.stream.ImageOutputStream;
import javax.net.ssl.HttpsURLConnection;
/**
* 图片背景处理,提高识别度
* @author FMm
*
*/
public class ImageConverter { private static List<File> fileList = new ArrayList<File>(); public static void main(String[] args) { // 图片所在的根目录 , 图片去除水印后的存储目录
// 支持批量去除图片水印,第一个参数为图片存在目录,第二为新建图片目录
convertAllImages("/Users/mac/Desktop/image/", "/Users/mac/Desktop/images/");
} private static void convertAllImages(String dir, String saveDir) {
File dirFile = new File(dir);
File saveDirFile = new File(saveDir);
dir = dirFile.getAbsolutePath();
saveDir = saveDirFile.getAbsolutePath();
loadImages(new File(dir));
for (File file : fileList) {
String filePath = file.getAbsolutePath(); String dstPath = saveDir + filePath.substring(filePath.indexOf(dir) + dir.length(), filePath.length());
System.out.println("converting: " + filePath);
replaceColor(file.getAbsolutePath(), dstPath);
}
} public static void loadImages(File f) {
if (f != null) {
if (f.isDirectory()) {
File[] fileArray = f.listFiles();
if (fileArray != null) {
for (int i = 0; i < fileArray.length; i++) {
loadImages(fileArray[i]);
}
}
} else {
String name = f.getName();
if (name.endsWith("png") || name.endsWith("jpg")) {
fileList.add(f);
}
}
}
} @SuppressWarnings("unused")
private static void replaceFolderImages(String dir) {
File dirFile = new File(dir);
File[] files = dirFile.listFiles(new FileFilter() {
public boolean accept(File file) {
String name = file.getName();
if (name.endsWith("png") || name.endsWith("jpg")) {
return true;
}
return false;
}
});
for (File img : files) {
replaceColor(img.getAbsolutePath(), img.getAbsolutePath());
}
} private static void replaceColor(String srcFile, String dstFile) {
try {
Color color = new Color(255, 195, 195);
replaceImageColor(srcFile, dstFile, color, Color.WHITE);
} catch (IOException e) {
e.printStackTrace();
}
} public static void replaceImageColor(String file, String dstFile, Color srcColor, Color targetColor)
throws IOException {
URL http;
if (file.trim().startsWith("https")) {
http = new URL(file);
HttpsURLConnection conn = (HttpsURLConnection) http.openConnection();
conn.setRequestMethod("GET");
} else if (file.trim().startsWith("http")) {
http = new URL(file);
HttpURLConnection conn = (HttpURLConnection) http.openConnection();
conn.setRequestMethod("GET");
} else {
http = new File(file).toURI().toURL();
}
BufferedImage bi = ImageIO.read(http.openStream());
if (bi == null) {
return;
} Color wColor = new Color(255, 255, 255);// 白色 for (int i = 0; i < bi.getWidth(); i++) {
for (int j = 0; j < bi.getHeight(); j++) {
System.out.println(i + "---" + j);
int color = bi.getRGB(i, j);
Color oriColor = new Color(color);
int red = oriColor.getRed();
int greed = oriColor.getGreen();
int blue = oriColor.getBlue();
// 以下if处是则改变图片颜色 将图片背景改变成纯白色,提高识别度
if (i < 4 | i > 100) {
bi.setRGB(i, j, wColor.getRGB());
//bi.setRGB()方法是把对应的xy坐标的颜色改变成纯白色Color wColor = new Color(255, 255, 255);// 白色
} if (j < 4 | j > 35) {
bi.setRGB(i, j, wColor.getRGB());
} if (red < 107 && greed < 107 && blue < 107) {
bi.setRGB(i, j, wColor.getRGB()); }
if ((red <= 255 && red > 200) & (greed <= 255 && greed >= 200) & blue <= 255 && blue >= 200) {
bi.setRGB(i, j, wColor.getRGB());
}
}
}
String type = file.substring(file.lastIndexOf(".") + 1, file.length());
Iterator<ImageWriter> it = ImageIO.getImageWritersByFormatName(type);
ImageWriter writer = it.next();
File f = new File(dstFile);
f.getParentFile().mkdirs();
ImageOutputStream ios = ImageIO.createImageOutputStream(f);
writer.setOutput(ios);
writer.write(bi);
bi.flush();
ios.flush();
ios.close();
}
}
package image.images; import java.io.File;
import java.util.regex.Matcher;
import java.util.regex.Pattern; import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
/**
* 读取验证码并返回结构
* @author FMm
*
*/
public class ReadImage { public static void main(String[] args) throws TesseractException {
ITesseract instance = new Tesseract();
//如果未将tessdata放在根目录下需要指定绝对路径,tessdata包下是tess4j训练语言包
instance.setDatapath("/Users/mac/Desktop/tessdata");
//如果需要识别英文之外的语种,需要指定识别语种,并且需要将对应的语言包放进项目中
instance.setLanguage("eng");
// 指定识别图片路径
File imgDir = new File("/Users/mac/Desktop/images/8.png");
long startTime = System.currentTimeMillis();
String ocrResult = instance.doOCR(imgDir);
System.out.println(ocrResult);
if(isStartWithNumber(ocrResult)) {
String start = ocrResult.substring(0,1);
String meg = ocrResult.substring(1,2);
String end = ocrResult.substring(2,3);
// 输出识别结果
System.out.println("OCR Result: \n" + ocrResult + "\n 耗时:" + (System.currentTimeMillis() - startTime) + "ms");
// 得出结果
System.out.println(start+meg+end+"="+(Integer.parseInt(start)+Integer.parseInt(end)));
} else {
System.out.println("仅支持数字");
return;
} } public static boolean isStartWithNumber(String str) {
Pattern pattern = Pattern.compile("[0-9]*");
Matcher isNum = pattern.matcher(str.charAt(0)+"");
if (!isNum.matches()) {
return false;
}
return true;
}
}
maven文件
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion> <groupId>image</groupId>
<artifactId>images</artifactId>
<version>0.0.1-SNAPSHOT</version>
<packaging>jar</packaging> <name>images</name>
<url>http://maven.apache.org</url> <properties>
<project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
</properties> <dependencies>
<dependency>
<groupId>org.apache.httpcomponents</groupId>
<artifactId>httpclient</artifactId>
<version>4.5.8</version>
</dependency>
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.12.1</version>
</dependency>
<dependency>
<groupId>commons-io</groupId>
<artifactId>commons-io</artifactId>
<version>2.5</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.47</version>
</dependency>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>3.8.1</version>
<scope>test</scope>
</dependency>
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.4.1</version>
</dependency>
</dependencies>
</project>
不是maven项目所需jar
p.p1 { margin: 0; font: 12px Menlo; color: rgba(66, 66, 66, 1) }
org/apache/httpcomponents/httpclient/4.5.8/httpclient-4.5.8.jar
org/apache/httpcomponents/httpcore/4.4.11/httpcore-4.4.11.jar
commons-logging/commons-logging/1.2/commons-logging-1.2.jar
commons-codec/commons-codec/1.11/commons-codec-1.11.jar
org/jsoup/jsoup/1.12.1/jsoup-1.12.1.jar
commons-io/commons-io/2.5/commons-io-2.5.jar
com/alibaba/fastjson/1.2.47/fastjson-1.2.47.jar
junit/junit/3.8.1/junit-3.8.1.jar
net/sourceforge/tess4j/tess4j/4.4.1/tess4j-4.4.1.jar
net/java/dev/jna/jna/5.4.0/jna-5.4.0.jar
com/github/jai-imageio/jai-imageio-core/1.4.0/jai-imageio-core-1.4.0.jar
org/ghost4j/ghost4j/1.0.1/ghost4j-1.0.1.jar
log4j/log4j/1.2.17/log4j-1.2.17.jar
commons-beanutils/commons-beanutils/1.9.2/commons-beanutils-1.9.2.jar
commons-collections/commons-collections/3.2.1/commons-collections-3.2.1.jar
org/apache/xmlgraphics/xmlgraphics-commons/1.4/xmlgraphics-commons-1.4.jar
com/lowagie/itext/2.1.7/itext-2.1.7.jar
org/apache/pdfbox/pdfbox/2.0.17/pdfbox-2.0.17.jar
org/apache/pdfbox/fontbox/2.0.17/fontbox-2.0.17.jar
org/apache/pdfbox/pdfbox-tools/2.0.17/pdfbox-tools-2.0.17.jar
org/apache/pdfbox/pdfbox-debugger/2.0.17/pdfbox-debugger-2.0.17.jar
org/apache/pdfbox/jbig2-imageio/3.0.2/jbig2-imageio-3.0.2.jar
net/sourceforge/lept4j/lept4j/1.12.3/lept4j-1.12.3.jar
org/jboss/jboss-vfs/3.2.14.Final/jboss-vfs-3.2.14.Final.jar
org/jboss/logging/jboss-logging/3.1.4.GA/jboss-logging-3.1.4.GA.jar
ch/qos/logback/logback-classic/1.2.3/logback-classic-1.2.3.jar
ch/qos/logback/logback-core/1.2.3/logback-core-1.2.3.jar
org/slf4j/slf4j-api/1.7.25/slf4j-api-1.7.25.jar
org/slf4j/jul-to-slf4j/1.7.28/jul-to-slf4j-1.7.28.jar
org/slf4j/jcl-over-slf4j/1.7.28/jcl-over-slf4j-1.7.28.jar
org/slf4j/log4j-over-slf4j/1.7.28/log4j-over-slf4j-1.7.28.jar
所需的tess4j文件,文件名称:tessdata/,这个文件你可以放在项目中,也可以放在其他位置但是路径不能写错
tessdata/
chi_sim.traineddata // 中文识别
eng.traineddata //数字识别 下载地址https://raw.githubusercontent.com/tesseract-ocr/tessdata/master/eng.traineddata
osd.traineddata
pdf.ttf
pdf.ttx
readme
tess4j官网文件下载:https://sourceforge.net/projects/tess4j/
破解网站码验证,Java实现,不调用任何平台api接口的更多相关文章
- 破解网站二维码验证,Java实现,不调用任何平台api接口
package image.images; import java.io.File; import java.io.IOException; import java.io.InputStream; i ...
- Java对接拼多多开放平台API(加密上云等全流程)
前言 本文为[小小赫下士 blog]原创,搬运请保留本段,或请在醒目位置设置原文地址和原作者. 作者:小小赫下士 原文地址:Java对接拼多多开放平台API(加密上云等全流程) 本文章为企业ERP(I ...
- Java生鲜电商平台-API接口设计之token、timestamp、sign 具体架构与实现(APP/小程序,传输安全)
Java生鲜电商平台-API接口设计之token.timestamp.sign 具体设计与实现 说明:在实际的业务中,难免会跟第三方系统进行数据的交互与传递,那么如何保证数据在传输过程中的安全呢(防窃 ...
- json-lib-2.4-jdk15.jar所需全部JAR包.rar java jsoup解析开彩网api接口json数据实例
json-lib-2.4-jdk15.jar所需全部JAR包.rar java jsoup解析开彩网api接口json数据实例 json-lib-2.4-jdk15.jar所需全部JAR包.rar ...
- 用Python调用华为云API接口发短信
[摘要] 用Python调用华为云API接口实现发短信,当然能给调用发短信接口前提条件是通过企业实名认证,而且有一个通过审核的短信签名,话不多说,showcode #!/usr/bin/python3 ...
- Angular 调用百度地图API接口
Angular 调用百度地图API接口 参考原文:https://blog.csdn.net/yuyinghua0302/article/details/80624274 下面简单介绍一下如何在Ang ...
- java EE技术体系——CLF平台API开发注意事项(4)——API生命周期治理简单说明
文档说明 截止日期:20170905,作者:何红霞,联系方式:QQ1028335395.邮箱:hehongxia626@163.com 综述 有幸加入到javaEE技术体系的研究与开发,也得益于大家的 ...
- Python如何调用新浪api接口的问题
前言:这些天在研究如何调用新浪开放平台的api分析新浪微博用户的数据 成果:成功调用了新浪api获取了用户的一些个人信息和无数条公共微博 不足:新浪开放平台访问有限制,返回的数据着实有限,不足以分析问 ...
- Java生鲜电商平台-API接口设计之token、timestamp、sign 具体设计与实现
转载:https://www.cnblogs.com/jurendage/p/12653865.html 说明:在实际的业务中,难免会跟第三方系统进行数据的交互与传递,那么如何保证数据在传输过程中的安 ...
随机推荐
- 拦截导弹(CDQ分治,DP)
很好的题,值得细细说,(果然又是个假期望)....... 首先我们提取信息,显然这是个三维偏序问题 用简单的DP式子表示需要满足 f[i]=max(f[1--j]+1)(v[j]<v[i],h[ ...
- csp-s模拟测试55(9.29)联「线段树」·赛「??」题「神仙DP」
T1 联 考试两个小时终于调过了,话说一个傻逼错最后还是静态查出错的..... 大概维护两个懒标记,一个区间覆盖,一个区间异或,然后保证每个区间只会存在一种懒标记. 然后维护区间0的个数,查询时查询那 ...
- bzoj1925 地精部落
神题! 地精部落 内存限制:128 MiB 时间限制:1000 ms 标准输入输出 题目描述 传说很久以前,大地上居住着一种神秘的生物:地精. 地精喜欢住在连绵不绝的山脉中.具体地说,一座长度 ...
- Tomcat与spring的类加载器案例
Tomcat与spring的类加载器案例接下来将介绍<深入理解java虚拟机>一书中的案例,并解答它所提出的问题.(部分类容来自于书中原文) Tomcat中的类加载器在Tomcat目录结构 ...
- ES6中的Module与Interator
小编今天在用Vue做项目的时候,发现组件中有import和export,刚好今天看到相关的语法介绍和一些实例,下面小编就和大家一起进步.对于模块化规范,在es6出现之前,有以下三种规范,分别是Comm ...
- 《面试补习》- Java集合知识梳理
一.ArrayList ArrayList 底层数据结构为 动态数组 ,所以我们可以将之称为数组队列. ArrayList 的依赖关系: public class ArrayList<E> ...
- 数据同步Datax与Datax_web的部署以及使用说明
一.DataX3.0概述 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).HDFS.Hive.ODPS.HBase.FTP等各种异构数据源之间稳定高 ...
- 通过Cloudflare API进行CDN刷新
1.Cloudflare CDN刷新说明 1.Cloudfalre同Akamai一样,只有刷新,没有预热的概念. 2.通过Cloudflare API进行刷新,需要用到登录用户的[邮箱][api密钥] ...
- Centos7.5使用SSH密钥登录
12.1.查看操作系统版本 # cat /etc/redhat-release CentOS Linux release 7.5.1804 (Core) 12.2.在服务器端创建密钥 # ssh-ke ...
- 卧槽,原来不需要FQ就可以构建海外镜像
一. 背景 使用docker或者k8s的过程中,我们可能遇到镜像无法下载的情况,例如:kubernetes的kube-apiserver镜像,这是因为其仓库在海外,我们的网络被墙,我发获取到该资源,使 ...