直接在Chrome里抓取数据

一个小测试发现可以自动做题，于是想通过脚本的方式看能不能获取相应的题库，刚好可以学习一下JS异步操作。花了一天时间，总算跑顺利了，遇到了不少坑。记录下来分享。

1、JS如何顺序执行

JS有强大的异步操作机制，但由于之前顺序执行的思路受限，直接用For循环的话会把请求结果的顺序搞乱。因此需要让JS在异步的基础上还能够顺序执行，基本的办法是采用Callback的方式。同时为了避免JS在页面的DOM进行操作过程中出现DOM不存在的情况使用SetTimeout来延时执行（这个地方费了了小半天时间）。

注意由于程序代码中有使用$.ajax请求，因此把回调的语句放到$ajax请求的Success方法里。

基本代码结构代码如下：

var i = 0;

var loopCall = function(count) {

    callProcess(i, function() {

        i++;

        if (i < count) {

            loopCall(count);

        }

    });

};

function callProcess(i, callback) {

    console.log('running on: ' + i.toString());

    //process code

    //...

    //...

    //使用setTimeout延时，避免DOM操作错误

    setTimeout(function(){callback();},100);

}

loopCall(1000);

2.数据怎么存储

之前只知道有LocalStorage，开发过程中Google了一下才知道有WebSQL，语法和操作也挺简单，也尝试过使用数组变量来存储数据，但发现变量数据大于150K左右的时候浏览器就很慢。因此使用WebSQL来存储

var db = openDatabase(' mydatabase ', '2.0', 'my db', 2 * 1024);

   db.transaction(function (tx) {

     tx.executeSql('CREATE TABLE IF NOT EXISTS t1 (id unique, log)');

     tx.executeSql('INSERT INTO t1

                           (id,log) VALUES (?, ?'), [e_id, e_log];  //e_id和e_log是外部变量

   });

总结

其他处理代码基本就是原来的页面代码拷贝过来修改修改另加一定的调试。之前想用JS来写一直没有找到场景，现在用了虽然遇到点问题但总算是克服过了。不过JS在异步调用想处理成同步的多层嵌套之后还是需要好好规划一下，虽然在ES6之后增加了Promise类型。

直接在Chrome里抓取数据的更多相关文章

玩爽了！直接在Chrome里抓取数据
一个小测试发现可以自动做题,于是想通过脚本的方式看能不能获取相应的题库,刚好可以学习一下JS异步操作.花了一天时间,总算跑顺利了,遇到了不少坑.记录下来分享. 1.JS如何顺序执行 JS有强大的异步操 ...
Java 实现 HttpClients+jsoup，Jsoup，htmlunit，Headless Chrome 爬虫抓取数据
最近整理一下手头上搞过的一些爬虫,有HttpClients+jsoup,Jsoup,htmlunit,HeadlessChrome 一,HttpClients+jsoup,这是第一代比较low,很快就 ...
selenium+chrome抓取数据，运行js
某些特殊的网站需要用selenium来抓取数据,比如用js加密的,破解难度大的 selenium支持linux和win,前提是必须安装python3,环境配置好抓取代码: #!/usr/bin/en ...
【转】蓝牙4.0BLE cc2540 usb-dongle的 SmartRF Packet Sniffer 抓取数据方法--不错
原文网址:http://blog.csdn.net/mzy202/article/details/32408223 蓝牙4.0BLE cc2540 usb-dongle的 SmartRF Packet ...
nodejs抓取数据一(列表抓取)
纯属初学...有很多需要改进的地方,请多多指点... 目标是抓取58同城这个大分类下的列表数据: http://cd.58.com/caishui/?PGTID=14397169455980.924 ...
Java模拟新浪微博登陆抓取数据
前言: 兄弟们来了来了,最近有人在问如何模拟新浪微博登陆抓取数据,我听后默默地抽了一口老烟,暗暗的对自己说,老汉是时候该你出场了,所以今天有时间就整理整理,浅谈一二. 首先: 要想登陆新浪微博需要 ...
测试开发Python培训：抓取新浪微博抓取数据-技术篇
测试开发Python培训:抓取新浪微博抓取数据-技术篇 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在poptest的se ...
C#抓取数据、正则表达式+线程池初步运用
去年底用多线程+HtmlAgilityPack.dll 写了一个抓取“慧聪网” 公司信息的小程序,代码惨不忍赌.好在能抓到数据,速度也能让人忍受就很久没管了. 最近这段时间把这个小程序发给同事看着玩 ...
分布式爬虫：使用Scrapy抓取数据
分布式爬虫:使用Scrapy抓取数据 Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scrapy用途广泛,可以用于数据挖掘. ...

随机推荐

IDE硬盘 SCSI硬盘 SATA硬盘
IDE一般是有扁平电缆连接的,一个扁平电缆可以连接2个IDE硬盘,而一个计算机一般提供2个扁平电缆,所以一般允许4块IDE硬盘.IDE经过多年的发展,成熟,廉价,稳定.一般老式的电脑中装的都是这种硬盘 ...
jQuery页面加载后执行的事件(3种方式)
$(function () { }); $(document).ready(function () { }); window.onload = function () { }
使用Jquery+EasyUI 进行框架项目开发案例讲解之三---角色管理源码分享
使用Jquery+EasyUI 进行框架项目开发案例讲解之三角色管理源码分享在上两篇文章 <使用Jquery+EasyUI进行框架项目开发案例讲解之一---员工管理源码分享> ...
object_id的用法
OBJECT_ID: 返回数据库对象标识号. 语法 OBJECT_ID ( 'object' ) 参数 'object' 要使用的对象.object 的数据类型为 char 或 nchar.如果 ob ...
composer很慢修改镜像
有两种方式启用本镜像服务: 系统全局配置: 即将配置信息添加到 Composer 的全局配置文件 config.json 中.见“例1” 单个项目配置: 将配置信息添加到某个项目的 composer. ...
SWF类标准开头Tag
[SWF(width="800", height="600", backgroundColor="#ffffff", frameRate=& ...
Linux Ubuntu常用终端命令
查看cpu温度: 安装命令如下:sudo apt-get install acpi 然后acpi -t 即可输入法配置窗口命令: fcitx-config-gtk3 im-config 任务管理器命 ...
CCF真题之相邻数对
201409-1 问题描述给定n个不同的整数,问这些数中有多少对整数,它们的值正好相差1. 输入格式输入的第一行包含一个整数n,表示给定整数的个数. 第二行包含所给定的n个整数. 输出格式输出一 ...
Spark on Mesos部署
一.Mesos的安装和部署 1.下载mesos源码和依赖包部署环境 centOS 6.6 mesos-0.21.0 spark-1.4.1 因为mesos官方只提供源码,所以必须要自己进行编译安装使 ...
Android Handler练习
package com.example.myact12; import java.util.Random; import android.support.v7.app.ActionBarActivit ...

直接在Chrome里抓取数据

直接在Chrome里抓取数据的更多相关文章

随机推荐

热门专题