迁移cnblog博客

title: 迁移cnblog博客

date: 2018-03-18

categories: cnblogs

tags: life

写博客最怕就是这种迁来迁去的，太麻烦了

还好老早就使用markdown编写，纯文本直接复制就可以了，格式不会差到哪去的，最低的保障有了可是还是很麻烦

在cnblogs后台控制面板找到 博客备份，这个可以将所有博客导出到一个xml文件中，确实方便了很多，感谢cnblogs

后面就是各自用办法解析xml的问题了

我这里直接使用bash来解析这个xml文件

代码如下

#!/bin/bash

#

set -e

for num in {1..60}

do

  title=$(echo "cat /rss/channel/item[${num}]/title/text()" |xmllint --shell cnblogs.xml | sed '1d;$d')

  pubDate=$(echo "cat /rss/channel/item[${num}]/pubDate/text()"|xmllint --shell cnblogs.xml | sed '1d;$d')

  datestr=$(date -d "$pubDate"  +"%Y-%m-%d %T")

  description=$(echo "cat /rss/channel/item[${num}]/description/text()" |xmllint --shell cnblogs.xml | sed -e '1d;$d' -e '2 s/<!\[CDATA\[//' | sed -e '$s/]]>$//')

  echo "---" >                   "${title}".md

  echo "title: $title" >>        "${title}".md

  echo "date: $datestr" >>       "${title}".md

  echo "categories: cnblogs" >>  "${title}".md

  echo "tags: linux" >>          "${title}".md

  echo "---" >>                  "${title}".md

  echo  >>                       "${title}".md

  echo "$description" >>         "${title}".md

done

这里几个说明：

我之前看了博客总数是60，这里就没有从xml文件里面获取总数了
新的blog也是使用markdown，不过头部需要注明一些扩展元素(title,date,categories,tags等)，这里直接写入这些信息
解析xml比较麻烦的就是正文内容了，之前的解析始终有xml的cdata字符(用--nocdata转换了特殊字符问题更大)，这里用两条sed语句去除
使用的解析xml的工具是xmllint，centos(各个发行版基本都提供对应命令)可以使用yum provides xmllint查看属于哪个包 (Repo: base, Name: libxml2)
其实这里sed还是很有趣的，学海无涯沧海一粟

最后按每条博客的标题生成一个markdown文件

附注：

毕竟不是python这种可以完美处理xml，可能会对解析xml的命令感到不解

这里我主要参考：https://unix.stackexchange.com/questions/83385/parse-xml-to-get-node-value-in-bash-script

也可以参考man手册，我这里之前用--xpath提取标题，导致编码有问题，使用这种方式可以正常处理

我把测试文件附加上

<?xml version="1.0"?>

<config>

    <global>

        <install>

            <date><![CDATA[Tue, 11 Dec 2012 12:31:25 +0000]]></date>

        </install>

        <crypt>

            <key><![CDATA[70e75d7969b900b696785f2f81ecb430]]></key>

        </crypt>

        <disable_local_modules>false</disable_local_modules>

        <resources>

            <db>

                <table_prefix><![CDATA[]]></table_prefix>

            </db>

            <default_setup>

                <connection>

                    <host><![CDATA[localhost]]></host>

                    <username><![CDATA[root]]></username>

                    <password><![CDATA[pass123]]></password>

                    <dbname><![CDATA[testdb]]></dbname>

                    <initStatements><![CDATA[SET NAMES utf8]]></initStatements>

                    <model><![CDATA[mysql4]]></model>

                    <type><![CDATA[pdo_mysql]]></type>

                    <pdoType><![CDATA[]]></pdoType>

                    <active>1</active>

                </connection>

            </default_setup>

        </resources>

        <session_save><![CDATA[files]]></session_save>

    </global>

    <admin>

        <routers>

            <adminhtml>

                <args>

                    <frontName><![CDATA[admin]]></frontName>

                </args>

            </adminhtml>

        </routers>

    </admin>

</config>

参考使用方式

{

# the given XML is in file.xml

host="$(echo "cat /config/global/resources/default_setup/connection/host/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

username="$(echo "cat /config/global/resources/default_setup/connection/username/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

password="$(echo "cat /config/global/resources/default_setup/connection/password/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

dbname="$(echo "cat /config/global/resources/default_setup/connection/dbname/text()" | xmllint --nocdata --shell file.xml | sed '1d;$d')"

printf '%s\n' "host: $host" "username: $username" "password: $password" "dbname: $dbname"

}

# output

# host: localhost

# username: root

# password: pass123

# dbname: testdb

迁移cnblog博客的更多相关文章

如何更快更好的写出cnblog博客？windows live writer推荐
之前总是会羡慕网上那些技术牛人的博客都写的那么给力,后来一搜发现还是有工具可用的. 这里就推荐一款写博客的"神器",Windows Live Writer (Get It Now! ...
cnblog博客CSS定制
一.页面定制CSS #home { margin: 0 auto; width: 80%;/*原始65*/ min-width: 980px;/*页面顶部的宽度*/ background-color: ...
cnblog博客停用
本博客从今日起停止更新,后续的文章将会发布在新的博客mrbackkom.github.io
emacs写cnblog博客
emacs的版本 org-mode版本参考链接: 用Emacs管理博客园博客用emacs org-mode写cnblogs博客用emacs org-mode写博客 & 发布到博客 ...
Cnblog博客美化
具体的使用教程文档在这里 BNDong/Cnblogs-Theme-SimpleMemory 简要的操作如下: 博客园 - 管理 - 设置值得注意得是: 要想JS代码要申请才可以使用博客侧边栏可 ...
cnblog博客管理
http://www.cnblogs.com/wc1903036673/ 12436109 https://www.cnb ...
一文搞定scrapy爬取众多知名技术博客文章保存到本地数据库，包含：cnblog、csdn、51cto、itpub、jobbole、oschina等
本文旨在通过爬取一系列博客网站技术文章的实践,介绍一下scrapy这个python语言中强大的整站爬虫框架的使用.各位童鞋可不要用来干坏事哦,这些技术博客平台也是为了让我们大家更方便的交流.学习.提高 ...
一步步开发自己的博客 .NET版（4、文章发布功能）百度编辑器
前言这次开发的博客主要功能或特点: 第一:可以兼容各终端,特别是手机端. 第二:到时会用到大量html5,炫啊. 第三:导入博客园的精华文章,并做分类.(不要封我) 第四:做个插件,任何网站上的技术 ...
第一篇博客：Hello World
2016年10月10日,双十,好日子,决定开始写第一篇博客,标题想了会,就叫Hello World 吧,哈哈^_^. 首先感谢博客园的管理们能批准我的申请,记得在14年的时候申请过一次,竟然没申请通过 ...

随机推荐

iOS-常用宏定义
下面我为大家提供一些常用的宏定义! 将这些宏定义加入到.pch使用再也不用用一次写一次这么长的程序了 //-------------------获取设备大小------------------- ...
JZOJ.5274【NOIP2017模拟8.14】数组
Description
AngularJS 讲解,一数据绑定
AngularJS 完全使用javascript 编写的客户端技术.通过原生的Model-View-Controller(MVC,模型视图控制器)功能增强了HTML.这个选择可以快捷和愉悦地构建出 ...
iOS 修改textholder的颜色
UITextField *textField = [[UITextField alloc]initWithFrame:CGRectMake(, , , )]; textField.placeholde ...
ionicframework I ------------- 初体验
ionicframework I ------------- 初体验 Create hybrid mobile apps with the web technologies you love. Fr ...
angular下如何绑定form表单的change事件
ng-change = "formChange()" 不起作用应该改为: onchanged = "angular.element(this).scope().form ...
3年工作经验的Java程序员面试经
转发自用~ 一.Java基础部分 1.使用length属性获取数组长度,public.private.protected.friendly区别 2.Collection和Collections区别 3 ...
Exchange Powershell：ForwardingAddress&InboxRule
查询在邮箱上设置的转发功能: Get-Mailbox -server MX01 -Filter {ForwardingAddress -like '*'} | Select-Object Name, ...
Linux内核设计与实现——内核同步
内核同步同步介绍同步的概念临界区:也称为临界段,就是訪问和操作共享数据的代码段. 竞争条件: 2个或2个以上线程在临界区里同一时候运行的时候,就构成了竞争条件. 所谓同步.事实上防止在临界区中形 ...
Python 模块之 time & datetime
Python 中提供了对时间日期的多种多样的处理方式,主要是在有 time 和 datetime 两个模块. time 在 Python 文档里,time 是归类在 Generic Operating ...

迁移cnblog博客

迁移cnblog博客的更多相关文章

随机推荐

热门专题