主要觉得往kindle里加书籍太麻烦了,要下载下来,还要通过邮件发送,特别一些网页文字版的书籍没办法放到kindle里,所以想着还不如自己动手丰衣足食,写一个程序直接抓取网页内容,制作成书籍,然后自动发送到kindle里. 程序首先操作简单“一键推送”,还有就是书籍要带目录. 先做了个winform版的,有时间再编写个Web版的. 程序相关的技术: 1.使用NSoup分析网页 2.爬虫规则设计 3.多线程爬网页 4.生成txt文本和pdf文件 5.使用邮件推送到自己的kindle设备 程序界面效…
参考: http://calibre-ebook.com/download_linux http://blog.codinglabs.org/articles/convert-html-to-kindle-book.html The Linux Command Line #TLCL.recipe from calibre.web.feeds.recipes import BasicNewsRecipe class The_Linux_Command_Line(BasicNewsRecipe):…
# 用asyncio和aiohttp抓取博客的总阅读量 (提示:先用接又找到每篇文章的链接) # https://www.jianshu.com/u/130f76596b02 import re import asyncio import aiohttp import requests import ssl from lxml import etree from asyncio.queues import Queue from aiosocksy import Socks5Auth from a…
最近在写往公司产品里添加Tomcat适配器,以支持Tomcat.有一些功能需要摘取到Tomcat的部分日志.没有合适的工具,也不想去网上找了,就自己写了一个. 简单的画了一下设计方案: 下面直接上代码了: 日志阅读器: package com.fjn.tools.log.reader; import java.io.File; import java.util.LinkedList; import java.util.List; import java.util.Scanner; import…
SpringBoot 小说爬虫搭建阅读网站 通过jsoup采集数据到mysql数据.redis作为缓存框架,减轻服务器压力.部署在linux,网站UI套纵横中文网! http://47.107.116.236:8080/fiction/index 介绍 web小说网站 软件架构 springboot+mybatisplus+jsoup+mysql 图片展示 首页 中间 阅读模式 底部 小说详情 章节列表 小说阅读 使用说明 idea 开发 演示地址 :http://47.107.116.236:…
http://images.cnblogs.com/cnblogs_com/elesos/1120632/o_111.png var commentscount = 1; 嵌套的评论算一条,这个可能有一点点误差,不过不影响 var username = "miniblog"; 阅读数在2w的才保存 先选一个 http://blog.csdn.net/leixiaohua1020/article/details/15811977 提取链接时,只提取visited_num>2w的 /…
Web应用程序与DD文件 Web应用程序 web应用程序是一种可以通过Web访问的应用程序.Web应用程序最大的好处是永和很容易访问应用程序.用户只需要有浏览器即可,不需要安装其他任何软件.一个Web应用程序是由完成特定任务的各种Web组件构成的,并通过Web将服务展示给外界.在实际应用中,Web应用程序是由多个Servlet.jsp页面.HTML文件及图像文件等组成的. 应用服务器 Web应用程序驻留在应用服务器上.应用服务器为Web应用程序提供一种简单.可管理的对话系统资源的访问机制.它也提…
一.抓取流程概述 1.nutch抓取流程 当使用crawl命令进行抓取任务时,其基本流程步骤如下: (1)InjectorJob 开始第一个迭代 (2)GeneratorJob (3)FetcherJob (4)ParserJob (5)DbUpdaterJob (6)SolrIndexerJob 开始第二个迭代 (2)GeneratorJob (3)FetcherJob (4)ParserJob (5)DbUpdaterJob (6)SolrIndexerJob 开始第三个迭代 -- 2.抓取…
Razor 在WebApp 框架的运用   前面有两章介绍了WebApp框架<WebApp MVC,“不一样”的轻量级互联网应用程序开发框架>和<WebApp MVC 框架的开发细节归纳>,其中视图引擎是用的Nvelocity,最近发现Razor不错,语法比较像C#,而且在VS IDE中有提示比较方便,更不错的是在CodePlex上已有人把Razor从aspx mvc中剥离出来独立的开源项目RazorEngine,立马就研究了一下并加入到框架中. RazorEngine开源网址:h…
Kindle 是一款非常优秀的阅读设备,它为我们提供了非常舒服的阅读体验,并且配合强大的亚马逊图书资源,应该是目前最好的阅读设备之一.Kindle 在已有的成就下还一直在努力提升用户体验.为中国用户开通的 Send to Kindle 就是一个非常好的例子,通过它我们可以将微信平台上的优秀文章发送到 Kindle 设备上面阅读. 关注服务号 首先,我们要关注 Kindle 的微信服务号 "cn_Kindle" : 绑定邮箱 关注完成后,在 Kindle 的微信服务号中输入 "…