chrome开发总结(交互/权限/存储)-爬虫

标签(空格分隔): 杂乱之地


经过一翻折腾。还是选择了chrome来做爬虫。主要是为了解决一些ajax加载的问题以及代理的问题。

1.chrome-配置文件

manifest.json

{
// 必选
"manifest_version": 2,
"name": "我的应用",
"version": "版本字符串", // 推荐
"default_locale": "en",
"description": "纯文本描述",
"icons": {...}, // 选择某一个(或者无)
"browser_action": {...},
"page_action": {...}, // 可选
"author": ...,
"automation": ...,
"background": {
// 推荐
"persistent": false
},
"background_page": ..., "commands": ..., "content_scripts": [{...}],
"content_security_policy": "策略字符串",
"converted_from_user_script": ...,
"current_locale": ..., "externally_connectable": {
"matches": ["*://*.example.com/*"]
}, "homepage_url": "http://path/to/homepage",
"import": ...,
"incognito": "spanning 或 split", "key": "公钥",
"minimum_chrome_version": "版本字符串", "offline_enabled": true, "optional_permissions": ...,
"options_page": "aFile.html",
"page_actions": ...,
"permissions": [...], "plugins": [...],
"requirements": {...}, "script_badge": ...,
"short_name": "短名称",
"signature": ...,
"spellcheck": ...,
"storage": {
"managed_schema": "schema.json"
}, "tts_engine": ...,
"update_url": "http://path/to/updateInfo.xml",
"web_accessible_resources": [...]
}

上面这些不是必须的。把自己需要的加上就可以了。基本上后面的都是不需要的。下面贴一个我的项目的配置

{
"name": "siteSpider",
"manifest_version": 2,
"version": "0.0.2",
"description": "相对单线程稳定版",
"browser_action": {
"default_icon": "spider.png",
"default_title": "spider",
"default_popup": "popup.html"
},
"permissions": [
"activeTab",
"webRequest",
"webNavigation",
"webRequestBlocking",
"proxy",
"*://*/*",
"tabs",
"storage",
"unlimitedStorage"
],
"background": { "scripts": ["js/jquery-1.11.2.min.js", "js/bk.js"] },
"content_scripts": [
{
"matches": [
"*://*/*"
],
"js": [
"js/jquery-1.11.2.min.js",
"js/content.js"
]
}
]
}

2. chrome-js简介

chrome一般情况下是3个js。这3个js分别是popup.js/background.js/content.js

这三个js的名字分别代表他们的位置及作用的地点。

  • popup.js是弹出的那个页面用的js。假如在弹出的页面引用了document.getElement.ById().则 他获取的是popup.html页面的内容。而不是当前页的。popup.js所作用的范围就是popup.

  • background.js:顾名思义,他是一个后台的js,在任何页面都可以调用。他主要的作用就是调度及与我们的后台发送ajax请求等。通过bk.js给popup/content来发送信息。操作tab以及做一些监听等操作。

  • content.js:是页面中的js,也就是tab中的js。在background.js可以通过

chrome.tabs.query(active:true,currentWindow:true,function(tabs){
//发送一些操作指令
})

来发送一些指令进行操作。并且只能使用chrome.extension.*的api.

3. chrome-交互

chrome插件交互一般是3种js之间的交互。

下面演示一下popup.js跟background.js的交互。

这是一个popup.html

<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Title</title>
<script type="text/javascript" src="js/jquery-1.11.2.min.js"></script>
<script type="text/javascript" src="js/popup.js"></script>
</head>
<body>
<div>
<!-- <div>
sku编码:<input type="text" id="sku"/>
</div> -->
<div>
抓取规则:<select id="rule">
<option value="tb">淘宝</option>
</select>
</div>
<div>
抓取页数:<input type="text" id="fetchNum" value="1"/>
</div>
<button id="startFetch">抓取</button>
<button id="hasLoginOk">已登录</button>
</div>
<div>
使用说明:
1.在淘宝搜索好关键词(可选择排序或其他淘宝功能)后,点击抓取。
2.如果出现登录验证,请登录后点击已登录,然后刷新当前网页。
3.插件正常运行中, 禁止使用该浏览器浏览其他网页。
</div>
<!-- <div id="html">
抓取总数:<span id="fetchTotals"></span>
</div>
-->
</body>
</html>

下面是popup.js

$(function() {//绑定按钮
$("#startFetch").bind("click", startFetch);
$("#hasLoginOk").bind("click",hasLoginOk);
})
function hasLoginOk() {
chrome.runtime.sendMessage({
type: "mustLoginIsOk"
},
function(response) {
});
}
function startFetch() {
var rule = $("#rule").val();
var num = $("#fetchNum").val();
var sku = $("#sku").val();
var baseUrl = $("#baseUrl").val();
chrome.runtime.sendMessage({//发送消息
type: "fetchUrls",
sku: sku,
rule: rule,
num: num,
baseUrl: baseUrl
},
function(response) {
$("#fetchTotal").html(response);
});
} /* chrome.extension.onMessage.addListener(function(request,_,response){
if(request.totals){
$("#fetchTotal").html("z");
$("#fetchTotal").html(request.totals);
}
}) */

可以看到popup.js通过chrome.runtime.sendMessage()来发送消息。

在backgroundjs通过chrome.extension.onMessage.addListener()来放置一个监听器。监听所有的请求。

总结 chrome-js之间的通信都是通过chrome-api的chrome.tabs.sendMessage,chrome.runtime.sendMessage,chrome.extension.onMessage.addListener()来进行的。

api地址:http://chajian.baidu.com/developer/extensions/api_index.html

下面是代码地址

https://github.com/wongloong/chromeSpider

chrome开发总结(交互/权限/存储)-爬虫的更多相关文章

  1. Chrome 开发工具指南

    Chrome 开发工具指南 谷歌 Chrome 开发工具,是基于谷歌浏览器内含的一套网页制作和调试工具.开发者工具允许网页开发者深入浏览器和网页应用程序的内部.该工具可以有效地追踪布局问题,设置 Ja ...

  2. 不仅仅是浏览器 走近Chrome开发人员工具

    Chrome浏览器以其简单.快速.安全.稳定.扩展丰富等特性受到了不少人的喜爱,除了这些特性,Chrome浏览器还提供了非常简单方便的开发人员工具,可以为开发提高效率,加上Chrome浏览器对HTML ...

  3. Web自动化之Headless Chrome开发工具库

    命令行运行Headless Chrome Chrome 安装(需要带梯子) 下载地址 几个版本的比较 Chromium 不是Chrome,但Chrome的内容基本来源于Chromium,这个是开源的版 ...

  4. AngularJS进阶(二十九)AngularJS项目开发技巧之localStorage存储

    AngularJS项目开发技巧之localStorage存储       注: localStorage深度学习 绪 项目开发完毕,测试阶段发现后台管理端二维码生成有问题,问题在于localStora ...

  5. Chrome 开发工具之Timeline

    之前有说到Element,Console,Sources大多运用于debug,Network可用于debug和查看性能,今天的主角Timeline更多的是用在性能优化方面,它的作用就是记录与分析应用程 ...

  6. Chrome 开发工具之Sources

    Sources面板主要用于查看web站点的资源列表及javascript代码的debug 熟悉面板 了解完面板之后,下面来试试这些功能都是如何使用的. 文件列表 展示当前页面内所引用资源的列表,和平常 ...

  7. Chrome 开发工具之Console

    前段时间看git的相关,记的笔记也大致写到了博客上,还有些因为运用不熟,或者还有一些疑惑点,暂时也不做过多纠缠,之后在实践中多运用得出结论再整理分享吧. 工欲善其事,必先利其器.要想做好前端的工作,也 ...

  8. winform快速开发平台 -> 通用权限管理之动态菜单

    这几个月一直忙APP的项目,没来得及更新项目,想想该抽出时间整理一下开发思路,跟大家分享,同时也希望得到宝贵的建议. 先说一下我们的权限管理的的设计思路,首先一个企业信息化管理系统一定会用到权限管理, ...

  9. Chrome开发工具之Console

    Chrome开发工具-Console 看了别人的博客,才发现在百度主页用开发工具“Console”可以看到百度的招聘信息 前端调试工具可以按F12打开,谷歌的开发工具中的Console面板可以查看错误 ...

随机推荐

  1. android开机过程简单描述

    1 开机引导bootloader,相当于电脑开机启动bios 2 引导过后可以进入三种模式:fastboot, recovery, linux kernel.前两种跟版本升级相关,正常开机进入linu ...

  2. 黑马程序员-NSDictionary和NSMutableDictionary

    NSDictionary和NSMutableDictionary:通过key和value进行对应,进行存储元素,能够方便提取所需的元素.key是不能够重复出现,但是value能够重复出现.NSDict ...

  3. NYOJ 737 石子合并(一)

    分析: 本题为区间型动态规划,dp[i][j] 表示从第 i 堆合并到第 j 堆的最小代价, sum[i][i] 表示第 i 堆到第 j 堆的石子总和,则动态转移方程: dp[i][j] = min( ...

  4. [Java基础]java中this和super

    一.this关键字 1.this概念 (参考:http://www.cnblogs.com/xdp-gacl/p/3636071.html)   this是一个引用,它指向自身的这个对象,它的内存分析 ...

  5. WIN8 隐私声明

    隐私权声明 本应用连接网络仅为控制硬件设备,不会收集你的个人信息,也不共享你个个人信息. 应用名称 CrossMedia可视化控制系统(服务器版) 关于本应用 本应仅为控制设备应用,不关注任何配置相关 ...

  6. ajax500错误

    昨天做一个需求,原先使用form提交的东西,领导说要改成使用ajax提交.嗯,听起来好像很简单很简单哦,可惜我已经很少敲代码了.擦,这工作让人槽点无数.果断写代码. var fm=document.g ...

  7. Disabling default console handler in Java Logger by codes

    The open source packages usu. relies on log4j or Java Logger to print logs, by default the console h ...

  8. 解剖SQLSERVER 第十七篇 使用 OrcaMDF Corruptor 故意损坏数据库(译)

    解剖SQLSERVER 第十七篇 使用 OrcaMDF Corruptor 故意损坏数据库(译) http://improve.dk/corrupting-databases-purpose-usin ...

  9. NoSQL学习二:MongoDB基本管理命令

    MongoDB命令学习  一.MongoDB命令帮助 在安装MongoDB后,启动服务器进程(mongod),可以通过在客户端命令mongo实现对MongoDB的管理和监控: 这是MongoDB最上层 ...

  10. .NET Mvc Razor也可以这样玩!

    忙碌的工作总是占据了生活的大部分的时间!所以我的博客到现在还是寥寥的几篇文章,技术是用来分享和学习的,对技术有不同的见解,大家都可以分享下,如果如下文章有问题之处请各位指出来,在这个闲下来的时间给大家 ...