Navi.Soft31.任务管理器(定时同步+数据采集)
1系统简介
1.1功能简述
在众多的软件分类中,有几类的软件不是很重要,但也很重要。它们有的是每隔一段时间需要执行一些任务的软件,我们叫它定时类软件;还有一种软件是采集网页中的数据,我们叫它采集类软件。
本产品是任务管理器,包括上述2种软件
同步服务,可以根据配置好的时间间隔执行任务。可以每隔一段时间,也可以在某个时间点执行
采集服务,可以采集指定页面的数据,用于大数据分析。可根据网址直接采集,也可以可视化采集(如:淘宝中我的订单,就是需要登录才能采集)
1.2运行环境
.NET Framework 4.0
1.3使用方法
双击软件图标,打开登录页面,验证成功后弹出如图1-1所示

图1-1
1.4产品亮点
l 定时模块,任务类型包括:间隔时间和时间点
l 采集模块,支持可视化采集和非可视化采集
l 完善的日志模块帮助问题的定位和解决
2同步服务
2.1配置同步项

只要定义好同步项,这些同步项可保存至内存中,也可以存储在数据库中。用于定义有哪些任务需要定时执行
2.2运行同步项

如上图所示
1, 记录同步项的开始和结束时间,定时执行次数,还有配置项,如:间隔时间,时间点等
2, 最下面的日志用于输出同步项的操作结果
2.3定时邮件
是指程序每间隔一定时间,向系统管理员发送邮件。以通知管理员系统运行正常
2.4配置采集项
是采集模块范围,下一部分详细描述
3数据采集
3.1主界面

图3-1
如上图所示
1. 本产品已经内置几个采集模板,如:博客园、糗事百科、淘宝网和1688(需登录后可视化采集)
2. 选中某个采集模板,点击:创建,相当于创建了这个模板的一个实例(可同时创建多个)
3. 再选中某个实例,点击:开始。实现采集数据
3.2创建实例

3.3开始采集

如上图所示
点击开始后,实现数据采集
3.4采集结果

3.5可视化采集

若是可视化采集,点击:开始的时候,会自动弹出可视化采集页面(注:有的需要登录)
3.5.1调试

l 取分页数:是指获取有多少分页,如下图所示

l 采集当页:是指只采集当前页数据,如下图所示

l 下一页:是指当前页采集完成后,直接触发:下一页按钮,实现页面翻转
3.5.2登录帐户
是指登录的帐户和密码,可直接复制。当然,需要提前配置好才行
3.5.3采集
采集是指采用调试中的方式,实现对所有页面的采集。步骤如下
a. 先获取有多少分页
b. 循环从第1页开始采集
c. 当前页采集成功后,再触发下一页按钮,采集第2页,直至所有页面均采集完成
3.6组件化开发

无论是可视化采集,还是非可视化采集。均已实现组件化开发。如:采集页面只有一个,不同的采集模板,只需传入不同的参数即可实现
4FAQ
4.1FAQ1
问:若360安全卫士开启时,会弹出是否允许此程序运行,如图8-1所示

图8-1
答:选择:一直允许运行(加入白名单)
4.2FAQ2
问:可视化采集页面中的浏览器控件用的是哪个?
答:可视化采集控件采用的是微信自带的WebBrowser控件,在Win7或Win10系统中,它需要修改注册,来保证使用的IE内核与系统的IE内核保持一致
5后记
对本产品感兴趣的,可以加我微信号(xiyang1011或13867408830)私聊
我的博客即将搬运同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/developer/support-plan
Navi.Soft31.任务管理器(定时同步+数据采集)的更多相关文章
- Navi.Soft31.阅读导航
Navi.Soft31.核心类库 Navi.Soft31.WinForm框架 Navi.Soft31.WebMVC框架 Navi.Soft31.微信WinForm框架 Navi.Soft31.Mobi ...
- 使用cwRsync实现windows下文件定时同步【转】
1.参考文献: 使用cwRsync实现windows下文件定时同步(备份) 文件同步工具CwRsync的使用方法及常用命令详解 2.背景: 当前的SCADA架构中,有1台Server,5台FE,还有1 ...
- C# 中web如何定时同步数据
之前做定时器同步方法试过很多方法, 不过都有些问题 1)quartz + IIS 方式(web项目发布到IIS上,出现IIS应用池回收问题) 2)用线程Timer方式 (出现多个线程同步同个任务问题) ...
- 使用cwRsync实现windows下文件定时同步
1.参考文献: 使用cwRsync实现windows下文件定时同步(备份) 文件同步工具CwRsync的使用方法及常用命令详解 2.背景: 当前的SCADA架构中,有1台Server,5台FE,还有1 ...
- Elasticsearch--Logstash定时同步MySQL数据到Elasticsearch
新地址体验:http://www.zhouhong.icu/post/139 一.Logstash介绍 Logstash是elastic技术栈中的一个技术.它是一个数据采集引擎,可以从数据库采集数据到 ...
- DBImport v3.5 中文版发布:数据库定时同步及文档生成工具(IT人员必备)
前言: 趁着最近的休息时间,只能多勤快些:多写代码,多更新文章. 因为一旦投入新的工作,估计博客又会恢复到一年才产几篇的状态. 对于DBImport,因为用户的意见,增加了一个亮点功能,让软件B格升为 ...
- 定时同步时间与crontab
date 月日时分年.秒date -s可以直接设置系统时间 比如将系统时间设定成1996年6月10日的命令如下.#date -s 06/10/96将系统时间设定成下午1点12分0秒的命令如下.#dat ...
- solr 7+tomcat 8 + mysql实现solr 7基本使用(安装、集成中文分词器、定时同步数据库数据以及项目集成)
基本说明 Solr是一个开源项目,基于Lucene的搜索服务器,一般用于高级的搜索功能: solr还支持各种插件(如中文分词器等),便于做多样化功能的集成: 提供页面操作,查看日志和配置信息,功能全面 ...
- 不同服务器数据库之间的数据定时同步到sql server (支持mysql,oracle数据库同步到sql server)
1,在目标数据库新增服务器对象->连接到服务器->新建服务器连接 2,编写数据同步业务PROC ALTER PROC TestProc AS BEGIN --打开完全事物回滚 SET XA ...
随机推荐
- webpack模块机制浅析【一】
webpack模块机制浅析[一] 今天看了看webpack打包后的代码,所以就去分析了下代码的运行机制. 下面这段代码是webpack打包后的最基本的形式,可以说是[骨架] (function(roo ...
- Hive 多分隔符的使用 (转载)
方法一)通过org.apache.hadoop.hive.contrib.serde2.RegexSerDe格式的serde. 1) 建表语句 #指定以^|~作为分隔符 CREATE TABlE ta ...
- 在eclipse中创建maven webapp项目时弹出错误-解决办法
在eclipse中创建maven webapp项目时报错: Could not resolve archetype org.apache.maven.archetypes:maven-archetyp ...
- 安利一个神器:Tmux
对于程序员来说,一个好用且高效的软件工具就如同加持了神技的游戏角色.下面就给大家介绍一个神器 Tmux 以及个人的使用总结. 一.我所认识的 Tmux 在工作中,我把 tmux 当作终端会话管理器来使 ...
- cmd 指令
dir 展示当前文件夹内的文件 mkdir 创建文件夹 c: 访问C盘 (d: f:) cd\ 返回主文件 cd .. 返回上一文件夹 cd test 打开文件夹 访问文件夹 rd 删除文件夹 ...
- Django_验证码
问题: 登录.注册.忘记密码时候,提交用户数据时候,需要用到用户填写验证码,如何生成验证码? 那,解决方法? 第三方模块 django-simple-captcha pip install djang ...
- linkin大话数据结构--apache commons工具类
Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动. 一.Commons BeanUtils 说明:针对Bean的一个工具集.由于Bean往往是有一堆ge ...
- linkin大话数据结构--Set
Set 集合 Set 集合不允许包含相同的元素,如果试把两个相同的元素加入同一个 Set 集合中,则添加操作失败. Set 判断两个对象是否相同不是使用 == 运算符,而是根据 equals 方法.也 ...
- mysql数据库安装注意事项:
mysql数据库安装注意事项: https://jingyan.baidu.com/article/642c9d34aa809a644a46f717.html(安装教程) 注意语言设置为gbk可以解决 ...
- MySQL数据库中实现对中文字段按照首字字母排序
转载自网络! 1. 在MySQL中,我们经常会对一个字段进行排序查询,但进行中文排序和查找的时候,对汉字的排序和查找结果往往都是错误的. 这种情况在MySQL的很多版本中都存在. 如果这个问题不解决, ...