Java获取新浪微博cookies
import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.ObjectOutputStream;
import java.util.Date;
import java.util.Iterator;
import java.util.LinkedList;
import java.util.List;
import java.util.Set;
import java.util.concurrent.TimeUnit; import org.apache.http.client.CookieStore;
import org.apache.http.impl.client.BasicCookieStore;
import org.apache.http.impl.cookie.BasicClientCookie;
import org.openqa.selenium.By;
import org.openqa.selenium.Cookie;
import org.openqa.selenium.TimeoutException;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.chrome.ChromeOptions;
import org.openqa.selenium.support.ui.ExpectedCondition;
import org.openqa.selenium.support.ui.WebDriverWait; public class GetMultiCookieMSinaTimely { public static void main(String[] args) throws Exception {
/*if(args.length == 3) {
GetMultiCookieMSinaTimely.cookieFile = args[0];
GetMultiCookieMSinaTimely.chromedriverPath = args[1];
GetMultiCookieMSinaTimely.cookieSavePath = args[2];
} else {
System.out.println(new Date() + "three args:cookieFile path,chromedriver path,cookie save path");
System.exit(0);
}*/
GetMultiCookieMSinaTimely.cookieFile = "E:\\学习\\微博爬虫\\cookie\\user.txt";
GetMultiCookieMSinaTimely.chromedriverPath = "E:\\学习\\微博爬虫\\cookie\\chromedriver.exe";
GetMultiCookieMSinaTimely.cookieSavePath = "E:\\学习\\微博爬虫\\cookie\\";
if(new File(GetMultiCookieMSinaTimely.cookieFile).isFile()) {
GetMultiCookieMSinaTimely getCookies = new GetMultiCookieMSinaTimely();
getCookies.getCookie();
} else {
System.err.println(new Date() + "args is not a file!");
} } private static String cookieFile;
private static String chromedriverPath;
private static String cookieSavePath;
private int cookieNumber;
public GetMultiCookieMSinaTimely() {
} public void getCookie() throws IOException, InterruptedException {
if(cookieFile == null || cookieFile.equals("")) {
System.err.println(new Date() + "no emailpw File!");
return;
}
cookieNumber=0;
File loginFile = new File(cookieFile);
FileInputStream fis=new FileInputStream(loginFile);
InputStreamReader isr=new InputStreamReader(fis, "UTF-8");
BufferedReader br = new BufferedReader(isr);
String temp; ChromeOptions options = new ChromeOptions();
options.addArguments("test-type");
System.setProperty("webdriver.chrome.driver", chromedriverPath); // ChromeDriverService service = new ChromeDriverService.Builder()
// .usingDriverExecutable(new File(chromedriverPath)).usingAnyFreePort().build();
// service.start(); List<String> uselessList = new LinkedList<String>(); while((temp = br.readLine()) != null) {
oneCookie(temp, uselessList);
}
List<String> tempUselessList = new LinkedList<String>();
while(uselessList.size()>0){
tempUselessList.clear();
for(String s:uselessList) {
oneCookie(s, tempUselessList);
}
uselessList.clear();
uselessList.addAll(tempUselessList);
}
br.close();
// 关闭 ChromeDriver 接口
// service.stop();
// System.out.println("ok!");
} private void oneCookie(String temp, List<String> uselessList) {
try {
String[] username_password = temp.split("\\|");
WebDriver driver = new ChromeDriver();
driver.manage().timeouts().pageLoadTimeout(100, TimeUnit.SECONDS);
System.out.println(new Date() + "logging... "+ temp);
driver.get("https://passport.weibo.cn/signin/login"); try {
(new WebDriverWait(driver, 10)).until(new ExpectedCondition<Boolean>() {
public Boolean apply(WebDriver d) {
return d.findElement(By.id("loginName")) != null;
}
});
}catch(TimeoutException e) {
System.out.println(new Date() + "TimeoutException,add "+temp+" to uselessList!");
uselessList.add(temp);
driver.quit();
return;
}
Thread.sleep(1500); WebElement username = driver.findElement(By.id("loginName"));
username.click();
username.clear();
username.sendKeys(username_password[1]);
WebElement password = driver.findElement(By.id("loginPassword"));
password.click();
password.clear();
password.sendKeys(username_password[2]);
WebElement submit = driver.findElement(By.id("loginAction"));
submit.click();
try {
(new WebDriverWait(driver, 5)).until(new ExpectedCondition<Boolean>() {
public Boolean apply(WebDriver d) {
return d.getTitle().toLowerCase().startsWith("微博");
}
});
}catch(TimeoutException e) {
System.out.println(new Date() + "useless account,add "+temp+" to uselessList!");
uselessList.add(temp);
driver.quit();
return;
}
// System.out.println(cookieNumber);
// System.out.println("success");
Set<Cookie> allCookies = driver.manage().getCookies(); try {
CookieStore cookiestore = new BasicCookieStore();
for (@SuppressWarnings("rawtypes")
Iterator iterator = allCookies.iterator(); iterator.hasNext();) {
Cookie cookie = (Cookie) iterator.next();
BasicClientCookie bcookie = new BasicClientCookie(cookie.getName(), cookie.getValue());
bcookie.setDomain(cookie.getDomain());
bcookie.setExpiryDate(cookie.getExpiry());
bcookie.setPath(cookie.getPath());
cookiestore.addCookie(bcookie);
} new File(cookieSavePath).mkdirs();
//FileWriter fWriter=null;
//BufferedWriter bw=null;
//PrintWriter pWriter=null;
File file = new File(cookieSavePath+"/cookie.file" + cookieNumber++);
//fWriter =new FileWriter(cookieSavePath+"/cookie"+cookieNumber++);
//bw=new BufferedWriter(fWriter);
//pWriter=new PrintWriter(bw);
//pWriter.write(cookiestore.toString());
FileOutputStream fos = new FileOutputStream(file);
ObjectOutputStream oos = new ObjectOutputStream(fos);
System.out.println("cookile:"+cookiestore);
oos.writeObject(cookiestore);
oos.close();
fos.close();
} catch (IOException e) {
System.out.println("IOException,add "+temp+" to uselessList!");
uselessList.add(temp);
}
driver.quit();
} catch(Exception e) {
e.printStackTrace();
System.out.println("Exception,add "+temp+" to uselessList!");
uselessList.add(temp);
return;
}
System.out.println(new Date() + "logging succeed! "+ temp);
} }
Java获取新浪微博cookies的更多相关文章
- js/java 获取、添加、修改、删除cookie(最全)
一.cookie介绍 1.cookie的本来面目 HTTP协议本身是无状态的.什么是无状态呢,即服务器无法判断用户身份.Cookie实际上是一小段的文本信息(key-value格式).客户端向服务 ...
- java获取https网站证书,附带调用https:webservice接口
一.java 获取https网站证书: 1.创建一个java工程,新建InstallCert类,将以下代码复制进去 package com; import java.io.BufferedReader ...
- java获取图片原始尺寸
java获取图片原始尺寸 URL url = null; InputStream is = null; BufferedImage img = null; try { url = new URL(pi ...
- java学习第13天( java获取当前时间,有关大数据的运算及精确数字运算,Date类)
一 java获取当前时间 学习一个函数,得到当前时间的准确值 System.currectTimeMillis(). 可以得到以毫秒为单位的当前时间.它主要用于计算程序运行时间,long start= ...
- Java获取Web服务器文件
Java获取Web服务器文件 如果获取的是服务器上某个目录下的有关文件,就相对比较容易,可以设定死绝对目录,但是如果不能设定死绝对目录,也不确定web服务器的安装目录,可以考虑如下两种方式: 方法一: ...
- 【java 获取数据库信息】获取MySQL或其他数据库的详细信息
1.首先是 通过数据库获取数据表的详细列信息 package com.sxd.mysqlInfo.test; import java.sql.Connection; import java.sql.D ...
- java获取获得Timestamp类型的当前系统时间。以及java.util.date 、java.sql.Date之间的转换
java获取取得Timestamp类型的当前系统时间java获取取得Timestamp类型的当前系统时间 格式:2010-11-04 16:19:42 方法1: Timestamp d = new T ...
- spring java 获取webapp下文件路径
spring java 获取webapp下文件路径 @RequestMapping("/act/worldcup_schedule_time/imgdownload") @Resp ...
- java 获取classpath下文件多种方式
java 获取classpath下文件多种方式 一:properties下配置 在resources下定义server.properties register.jks.path=classpath\: ...
随机推荐
- Java排序算法——快速排序
import java.util.Arrays; //================================================= // File Name : Arrays_Q ...
- Redis 安装,主从配置及Sentinel配置自动Failover
1.安装redis 首页地址:http://redis.io/ 下载地址:http://download.redis.io/ 下载最新的源码包 tar -zxvf redis-stable.tar.g ...
- python中单引号,双引号,多引号区别
先说1双引号与3个双引号的区别,双引号所表示的字符串通常要写成一行如:s1 = "hello,world"如果要写成多行,那么就要使用\ (“连行符”)吧,如s2 = " ...
- PHP isset 函数作用
isset函数是检测变量是否设置. 格式:bool isset ( mixed var [, mixed var [, ...]] ) 返回值: 若变量不存在则返回 FALSE 若变量存在且其值为NU ...
- PHP数组处理函数的使用array_reduce(二)
关于PHP数组操作函数更为细致的用法大家还可以参考PHP在线参考手册:http://php.net/manual/zh/index.php array_reduce — 用回调函数迭代地将数组简化为单 ...
- 【转】常用的shell脚本
from:http://blog.sina.com.cn/s/blog_4152a9f501013r6c.html 常用的shell脚本 (2012-10-10 22:09:07) 转载▼ 标签: 杂 ...
- 性能:15个JavaScript本地存储技术的函数库和工具
当构建更复杂的JavaScript应用程序运行在用户的浏览器是非常有用的,它可以在浏览器中存储信息,这样的信息可以被共享在不同的页面,浏览会话. 在最近的过去,这将有可能只被cookies文本文件保存 ...
- [译]我是怎么构建Node.js程序的
原文: http://blog.ragingflame.co.za/2015/4/1/how-i-build-nodejs-applications "保持简单, 保持模块化." ...
- 解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX
从网上抓了一些字节流,想打印出来结果发生了一下错误: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position ...
- JS/HTML 保存图片到本地:HTML <a> download 属性
JS如何保存图片到本地呢?自己百度一下吧! 这里想要说的是,可以利用 HTML 的 <a> 标签 来是实现保存图片到本地的功能,参考代码如下: <a href="http: ...