说明 非常感谢nick老师的提点老师博客:https://home.cnblogs.com/u/nickchen121/ 项目连接 1.码云:https://gitee.com/wjup/html_to_md (码云由于上传文件大小限制现在exe不是最新的,最新的再github上) 2.github:https://github.com/a568972484/html_to_md 功能介绍 功能一:批量爬取博客园首页的所有随笔字典并保存JSON文件,且随笔全部转成MD格式文件 功能二:输入指定随…
Ruby:多线程下载博客文章到本地的完整代码 #encoding:utf-8 require 'net/http' require 'thread' require 'open-uri' require 'nokogiri' require 'date' $queue = Queue.new #文章列表页数 page_nums = 8 page_nums.times do |num| $queue.push("http://www.cnblogs.com/hongfei/default.html…
使用metaweblog API实现通用博客发布 之 本地图片自动上传以及替换路径 通过metaweblog API 发布博文的时候,由于markdown中的图片路径是本地路径,将导致发布的文章图片不能正确查看.两种通用的办法是: 1 将图片发布到专用的图片服务器,然后将链接替换: 2 将图片发布到博客平台,然后将链接替换. 这篇小文件探讨的是第二种方式. 1 查找markdown 文件中的图片 使用正则表达式进行查找 def matchMarkdownLinks(post): return r…
解决"用PicGo-2.3.0-beta5 + GitHub做博客图床,github仓库图片文件不显示"的问题记录(备忘) 历时几个小时百度,终于靠自己理解解决了GitHub仓库图片无法显示的问题,感谢百度!!!感谢互联网!!! 还好我没放弃 看下图,遇到这种情况不要慌,如果你百度看到我这篇文章,那么恭喜你,你会节省大量百度时间!偷着乐吧,哈哈哈哈 解决方案: 修改本地HOSTS文件对Github网站加载的资源域名解析,具体操作如下: 如何修改本地hosts文件呢?别急,我教你!…
本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高的,大家千万要珍惜哦(-_-). 本文目录: 0.开发环境 1.目标介绍 2.爬取目标 2.1.csdn博客 2.1.1 如何判断是否为Ajax方式异步获取的? 2.1.2 爬虫实现 2.1.2.1 修改spider接口实现 2.1.2.2 修改items.py文件 2.1.2.3 修改pipeli…
前言 本篇文章会从本地(Windows 10)搭建-主题更换-部署阿里云详细步骤,如果在搭建过程中,遇到问题,可以通过博客页脚下的QQ联系我,或者在下面评论留言 一.本地搭建 1.安装前置 1.1安装git 在git官网下载最新版本的git即可,因为本地是Windows所以下载Windows版本即可,如下图所示,如果你是x64版本的电脑就下载红色箭头所指的版本,如果你是x32的就下载x32版本的. 下载完毕安装包之后全部next下一步即可 1.2安装node.js 安装hexo博客需要nodej…
本次发布主要是更新了编辑器,使其更好地支持文件上传.(1.8.0 版本变更记录请看这里) 我们的 Markdown 编辑器: 另外,我们对 HTTPS 的支持也更完善了,欢迎大家试用! 简介 Solo 是一款一个命令就能搭建好的 Java 开源博客系统,并内置了 15+ 套精心制作的皮肤.除此之外,Solo 还有着非常活跃的社区,文章分享到社区后可以让很多人看到,产生丰富的交流互动. 功能 Solo 沉淀至今的每一个功能你应该都会用到.我们不会将只有"20%"用户使用的功能添加进来,只…
用hexo搭建的博客网站在访问时出现403错误,经调查后发现是public文件夹下的index.html文件丢失. 在csdn上搜了一下发现大家都是查看是否有一下hexo的插件未安装,将未安装插件安装后即可. 但是经检查发现我的插件全部安装完毕,该方法不管用. 之后我将博客配置文件中的plugins设置给注释掉即解决该问题. 原理未知.对于具体是plugin是这个设置有影响还是plugin中设置的插件有影响未知. # plugins: # - hexo-generator-feed # feed…
在写 RSS 订阅接口的时候,发现最终输出文章的 RSS 时间(GMT时间),在本地上显示的时间和在服务器上显示的时间不一致. 原因是时区不一致,那么在 JavaScript 中,如何将时间转换为统一的时间呢? 1. 查看本地和服务器的时区 通过 date 命令,可以知道: 本地的时区是:GMT+0800 (CST) 服务器的时区是:GMT+0400 (MSK) 首先,需要明确的一点是,文章上的时间是基于本地时间的,也就是说是 GMT+0800 (CST). 2. 代码调试 便于理解,我们来举个…
在项目目录下新建一个 ‘uploads’文件夹以保存上传的文件 配置setting.py文件 MEDIA_URL = '/uploads/' MEDIA_ROOT = os.path.join(BASE_DIR, 'uploads') #设置上传的绝对路径 配置urls.py文件,设置路由 from django.conf.urls import url,include from django.contrib import admin from django.conf import settin…