1. google reader马上就要关闭了,最后一次看看俺的浏览记录吧

最近 30 天的统计信息

  • 全部订阅: 367
  • 已读条目: 151
  • 已点击的条目:41 个
  • 加星标条目: 16
  • 已发电子邮件条目: 0
2007年8月3日以来,您一共阅读了 27,306 个条目。

2. 对于以前订阅的资料和星标文章,可以通过takeout功能把链接下载下来,加到别的rss阅读器里面(俺用的是greatnews客户端阅读器)

对于星标的文章,按自己写了个py script把链接的内容也一起下载下来

#E:\soft\Python27\down_googlereader_starred.py

import urllib,os,sys
import json,string def getUrlContent(url):
fp =urllib.urlopen(url)
cont =fp.read()
fp.close()
return cont def ToFname(title):
rep_chars ='\n;:%&^|\\/?<>'
s= title
for i in rep_chars:
s = s.replace('%c'%(i),'')
return s valid_chars = "-_.() %s%s" % (string.ascii_letters, string.digits)
return ''.join(c for c in title if c in valid_chars) def GetCfg_latest_id():
fname ='cfg.txt'
latest_id =0
if os.path.isfile(fname):
fp =open(fname,'r')
latest_id =int(fp.readline().strip())
fp.close()
return latest_id def logFile(fname, cont):
#if os.path.isfile(fname):
# print fname, 'esist!' fp=open(fname,'w')
fp.write(cont)
fp.close() def SetCfg_latest_id(id):
fname ='cfg.txt'
logFile(fname, '%d'%(id)) cont =open(r'F:\sw\<foldername>-takeout\Reader\starred.json','r').read()
li =json.loads(cont) latest_id =GetCfg_latest_id()
for item in li['items'][latest_id:]:
url =item['alternate'][0]['href']
title =item['title']
print title
fname ='%.3d.%s.htm'%(latest_id, ToFname(title))
print fname
isExcept =0
try:
urlcont =getUrlContent(url)
open(fname,'w').write(urlcont)
except Exception, e:
print e
isExcept =1
urlcont ='%s\n<br>\n%s<br>\n%s'%(url,str(e),fname)
urlcont= urlcont.encode('gb2312')
fname ='%.3d.Except.htm'%(latest_id)
open(fname,'w').write(urlcont) latest_id =latest_id+1
SetCfg_latest_id(latest_id)

自动下载google reader里面的星标文章的更多相关文章

  1. springboot实战开发全套教程,让开发像搭积木一样简单!Github星标已上10W+!

    前言 先说一下,这份教程在github上面星标已上10W,下面我会一一给大家举例出来全部内容,原链接后面我会发出来!首先我讲一下接下来我们会讲到的知识和技术,对比讲解了多种同类技术的使用手日区别,大家 ...

  2. 解放双手!推荐一款 GitHub 星标 8.2k+的命令行软件管理器,非常酷炫!

    小二是公司新来的实习生,之前面试的过程中对答如流,所以我非常看好他.第一天,我给他了一台新电脑,要他先在本地搭建个 Java 开发环境. 二话不说,他就开始马不停蹄地行动了.真没想到,他竟然是通过命令 ...

  3. 终于说再见了!Google Reader

    终于说再见了!Google Reader 投递人 itwriter 发布于 2013-07-02 13:28 评论(5) 有760人阅读  原文链接  [收藏]  « » 今天 15:00 左右,Go ...

  4. 批量下载google 字体小工具

    在项目开发中,我们经常用外国的框架,如bootstrap.nodejs.angularjs 时候经常要配套google 字体等资源, 但是由于国内网络原因,经常框架跑起来,网页在请求google 字体 ...

  5. 纪念google reader

    2013年3月14日早上,谷歌在其官方博客宣布,2005年推出的 Google Reader 将在7月1号关闭. google reader的历史 以下搞自维基百科http://zh.wikipedi ...

  6. 网页下载Google Play 的App

    前言 当你想在google play上下载某个应用,而无奈手机的系统并没有安装google servicess,此刻是否有些捉急? 本文分享的是一个网站,它可以无需手机而直接通过网页下载Google ...

  7. 【图文详解】python爬虫实战——5分钟做个图片自动下载器

    python爬虫实战——图片自动下载器 之前介绍了那么多基本知识[Python爬虫]入门知识,(没看的先去看!!)大家也估计手痒了.想要实际做个小东西来看看,毕竟: talk is cheap sho ...

  8. 【壁纸自动换】自动下载、更换壁纸(Bing壁纸)--XinBSBingWallPaper[2.7更新]

    XinBSBingWallPaper主要功能: 1.支持自动下载Bing壁纸.Netbian壁纸.美国国家地理杂志图片. 2.自动搜索.下载多国Bing首页壁纸. 3.支持定时自动更换桌面壁纸. 4. ...

  9. PZISP自动下载软件运行时出现“应用程序无法启动,因为应用程序的并行配置不正确”

    在win7下以管理员身份运行“PZISP自动下载软件”时出现“应用程序无法启动,因为应用程序的并行配置不正确”时,是因为系统里面没有一些visual c++库 想一想,反正以后也要用上VS2010的, ...

随机推荐

  1. DB开发之oracle存储过程

    1. 存储过程格式 /* Formatted on 2011/1/17 13:20:44 (QP5 v5.115.810.9015) */ CREATE OR REPLACE procedure pr ...

  2. 浅谈padding

    浅谈padding padding是CSS盒子模型的一部分,代表盒子模型的内边距. 用法 padding属性有四个值,分别代表上.右.下.左的内边距. .box { padding: 10px 5px ...

  3. opencv-ios开发笔记9 使用透视变换矫正扭曲的图片

    http://blog.csdn.net/baixiaozhe/article/details/51762086 摄像头观察一个矩形的图片时往往只能得到一个扭曲的图片: 原图: 实际情况是摄像头经常从 ...

  4. Vue学习笔记之vue-cli脚手架项目中组件的使用

    在webpack-simple模板中,包括webpck模板.一个.vue文件就是一个组件. 为什么会这样呢?因为webpack干活了!webpack的将我们所有的资源文件进行打包.同时webpack还 ...

  5. Linux内核分析 05

    扒开系统调用的三层皮(下) 一,给MenuOS增加time和time-asm命令 把time和time-asm添加到MenuOS里面去 作为命令.扩展MenuOS的功能.本周把上周增加的系统调用添加进 ...

  6. Python3基础 try-except 几个异常采取同样的处理方法

             Python : 3.7.0          OS : Ubuntu 18.04.1 LTS         IDE : PyCharm 2018.2.4       Conda ...

  7. 详解KMP算法【转】

    本文转载自:http://www.cnblogs.com/yjiyjige/p/3263858.html KMP算法应该是每一本<数据结构>书都会讲的,算是知名度最高的算法之一了,但很可惜 ...

  8. ES7学习笔记——Array.prototype.includes和求幂运算符**

    一直以来,在前端开发时使用的基本都是ES5,以及少量的ES6.3月份换工作面试时,发现一些比较大的公司,对ES6比较重视,阿里的面试官直接问ES7和ES8,对于从未接触过人来说,完全是灾难.由此也显现 ...

  9. P4factory ReadMe 剩余部分

    Building and Running a Target Each P4 program (called a 'target') is set up in a directory under tar ...

  10. postgres10.2时区研究

    搭建两个虚拟环境,操作系统均是cents7. 环境A: 使用timedatectl命令查看时区为 Time zone: Asia/Shanghai (CST, +0800). 本地数据库时区(show ...