获取web.py上面的示例code

import requests

import re

import os.path

#取得文件名和内容对应字典

def getCode(url):

    pattern=re.compile(r'<h\d>([^<]+)?</h\d>\n*<pre><code>[^<]*</code>{1}?',re.S)

    dic={}

    r=requests.get(url)

    if r.status_code==200:

        for g in re.finditer(pattern,r.text):

            dic[g.group(1)]=g.group(0)

    return dic

#输出到文件中

def saveFile(saveDir,dic):

    if not os.path.isdir(saveDir):

        os.makedirs(saveDir)

    for key in dic:

        print key,dic[key]

        #

        outPath=saveDir

        fileName=key

        rIndex=key.rfind("/")

        if rIndex!=-1:

            outPath=outPath+"\\"+key[:rIndex]

            fileName=key[rIndex+1:]

            if not os.path.isdir(outPath):

                os.makedirs(outPath)

        outFile=open(outPath+"\\"+fileName,'w')

        beginIndex=dic[key].find("<code>")

        endIndex=dic[key].find("</code>")

        if beginIndex==-1 or endIndex==-1:

            print "<code> have not"

            return

        subs=dic[key][beginIndex+6:endIndex]

        outFile.write(subs)

        outFile.close()

url1='http://webpy.org/skeleton/0.3'

url2='http://webpy.org/src/blog/0.3'

url3='http://webpy.org/src/todo-list/0.3'

url4='http://webpy.org/src/wiki/0.3'

urls=(url1,url2,url3,url4)

for url in urls:

    #取得文件名和内容对应字典

    dic=getCode(url)

    #相对目录不变

    proPath=url.replace("http://","\\").replace("/","\\")

    #保存根目录设定在【f:\pyworkspace】下

    saveFile(r'f:\pyworkspace'+proPath,dic)

获取web.py上面的示例code的更多相关文章

python获取动态网站上面的动态加载的数据（初级）
我们在处理一些网站数据的时候,有时候我们需要的数据很多都是动态加载的,而不都是静态的,以下以一个实例来介绍简单的获取动态数据,首先申明本人小白,还在学习python中,这个方法还是比较笨拙的,但是对于 ...
web.py上传文件并解压
有个需求是从php端上传zip文件到python端并且解压到指定目录,以下是解决方法 1.python端,使用的web.py def POST(self): post_data = web.input ...
python获取动态网站上面的动态加载的数据（selenium+Firefox）
最近突然想到以前爬取百度学术上的参考文献,大家可以看一下以前我的写的博客:http://www.cnblogs.com/ybf-yyj/p/7351493.html,但是如果利用这个方法,太痛苦了,需 ...
简单而直接的Python web 框架：web.py
web.py 是一个Python 的web 框架,它简单而且功能强大.web.py 是公开的,无论用于什么用途都是没有限制的. 先让大家感受一下web.py 的简单而强大: import web ur ...
如何批量清除128组节点db上面的过期的binlog，释放磁盘空间。(转)
如果10台以内的db的话,自己手动ssh进去,clean就足以,但是上百台呢,就要写脚本了.大概思路:在一台db跳转机上面, 写一个脚本,访问slave,远程获取正在复制的master上面的binl ...
清理：db上面的过期的binlog，释放磁盘空间。（转)
如果10台以内的db的话,自己手动ssh进去,clean就足以,但是上百台呢,就要写脚本了.大概思路:在一台db跳转机上面, 写一个脚本,访问slave,远程获取正在复制的master上面的binl ...
Aaron Swartz Rewriting Reddit中关于web.py的创建思路
这天才少年居然自杀了,哎原文点这 So how should things work? The first principle is that code should be clear and si ...
jQuery Ajax使用FormData上传文件和其他数据，后端web.py获取
参考博文: 通过jQuery Ajax使用FormData对象上传文件方法一:使用<form>表单初始化FormData对象方式上传文件前端(JQuery): <form enc ...
context.getResourceAsStream获取的是部署在服务器上面的文件位置而不是我们本地的工程位置意思是说获取的都是web下面的文件位置
context.getResourceAsStream获取的是部署在服务器上面的文件位置而不是我们本地的工程位置意思是说获取的都是web下面的文件位置

随机推荐

急！急！急！请问win32api参数乱码如何解决！
我想做一个QQ自动登陆,使用的QQ是2009.现在先模拟打开QQ,然后通过api调用回调函数.回调函数为一个委托方法,但是在方法中整个参数乱码,请问如何解决? 具体流程为,启动QQ,获取当前启动QQ的 ...
虚拟机Visualbox安装CentOS
选择安装CentOS系统进入了安装界面,选择语言,并选择继续安装的主界面 1.先选择日期时间,选择了亚洲,并选择上海,再点击左上角的完成按钮 2.再选择键盘,选择英文 3.选择语言为英语 4.选择 ...
BZOJ 3261: 最大异或和位置-贪心+可持久化01Trie树
3261: 最大异或和 Time Limit: 10 Sec Memory Limit: 512 MBSubmit: 3519 Solved: 1493[Submit][Status][Discu ...
vim的保存文件和退出命令
文章来源:http://blog.sina.com.cn/s/blog_5e357d2d0100zmth.html 命令简单说明 :w 保存编辑后的文件内容,但不退出vim编辑器.这个命令的作用是把 ...
633. Sum of Square Numbers【Easy】【双指针-是否存在两个数的平方和等于给定目标值】
Given a non-negative integer c, your task is to decide whether there're two integers a and bsuch tha ...
洛谷——P2121 拆地毯
P2121 拆地毯题目背景还记得 NOIP 2011 提高组 Day1 中的铺地毯吗?时光飞逝,光阴荏苒,三年过去了.组织者精心准备的颁奖典礼早已结束,留下的则是被人们踩过的地毯.请你来解决类似于 ...
shell脚本报错退出
在shell脚本中,比如有以下的代码: cd /root/test88 rm -rf backup 如果目录/root/test88不存在,脚本不会停止,依然会执行rm -rf backup这个命令 ...
(转) HA的几种方案
数据库HA 一般把数据库层面的HA,和应用层面HA分开考虑数据库一般采用数据库产品提供的HA方案,比如Oracle的RAC,mysql的集群,mongodb的replica set等无HA的运 ...
前m大的数
前m大的数 Time Limit: 1000 MS Memory Limit: 32768 KB 64-bit integer IO format: %I64d , %I64u Java class ...
【BZOJ 1998】 1998: [Hnoi2010]Fsk物品调度（双向链表+并查集+置换）
1998: [Hnoi2010]Fsk物品调度 Description 现在找工作不容易,Lostmonkey费了好大劲才得到fsk公司基层流水线操作员的职位.流水线上有n个位置,从0到n-1依次编号 ...

获取web.py上面的示例code

获取web.py上面的示例code的更多相关文章

随机推荐

热门专题