【Python】torrentParser1.02
#------------------------------------------------------------------------------------
# torrentParser1.02,用于解析torrent文件
# 增加函数getStructure,getFilepathname
# 2018年5月9日
#------------------------------------------------------------------------------------
from bencode import bdecode
import time
#-------------------------------------
# torrentParser类
#-------------------------------------
class torrentParser(object):
# 构造函数
def __init__(self,filePathname):
self.filePathname=filePathname
with open(filePathname,'rb') as fObj:
self.fileDic=bdecode(fObj.read())
# 得到文件路径名
def getFilepathname(self):
return self.filePathname
# 得到所有键值
def getKeys(self):
return self.fileDic.keys()
# 得到全部内容
def getAllContent(self):
return self.fileDic;
# 得到文件结构
def getStructure(self):
retval=''
layer=0
for key in self.fileDic.keys():
value=self.fileDic[key]
retval=retval+self.getNextNode(key,value,layer)
return retval
# 向下递归查找文件结构,
def getNextNode(self,key,value,layer):
retval="";
layer+=1
if type(value)==type({}) and len(value.keys())>0:
for i in range(1,layer+1):
retval=retval+"\t"
retval=retval+str(key)+"\n"
for k in value.keys():
v=value[k]
retval=retval+ self.getNextNode(k,v,layer)
elif type(value)==type([]) and len(value)>0:
for i in range(1,layer+1):
retval=retval+"\t"
retval=retval+str(key)+"\n"
arr=value
for it in arr:
if type(it)==type({}) and len(it.keys())>0:
for nk in it.keys():
nv=it[nk]
retval=retval+ self.getNextNode(nk,nv,layer)
else:
for i in range(1,layer+1):
retval=retval+"\t"
retval=retval+str(key)+"\n"
return retval
# 获得tracker服务器的URL
def getAnnounce(self):
if 'announce' in self.fileDic:
return self.fileDic['announce'].decode('utf-8')
return ''
# 获得tracker服务器的URL列表
def getAnnounceList(self):
retval=[]
if 'announce-list' in self.fileDic:
arr=self.fileDic['announce-list']
for childArr in arr:
if type(childArr)==type([]):
for item in childArr:
retval.append(item.decode('utf-8'))
else:
retval.append(childArr.decode('utf-8'))
return retval
# 得到制作日期
def getCreateTime(self):
if 'creation date' in self.fileDic:
unixTimestamp=self.fileDic['creation date']
firmalTime = time.localtime(unixTimestamp)
dt = time.strftime('%Y-%m-%d %H:%M:%S', firmalTime)
return dt
else:
return ''
# 获得编码方式
def getEncoding(self):
if 'encoding' in self.fileDic:
return self.fileDic['encoding'].decode('utf-8') #去掉字符串前面的b'
return ''
# 是否包含多个文件
def hasMultiFiles(self):
if 'files' in self.fileDic['info']:
return True
else:
return False
# 获得文件名
def getTitle(self):
arr=[]
info = self.fileDic['info']
if 'name.utf-8' in info:
arr=info['name.utf-8']
else:
arr = info['name']
#print(str(arr))
return arr.decode('utf-8') # \x 开头编码的数据解码成中文
# 获得备注(可选项)
def getComment(self):
if 'comment' in self.fileDic:
return self.fileDic['comment'].decode('utf-8')
return ''
# 获得创建者(可选项)
def getCreatedBy(self):
if 'created by' in self.fileDic:
return self.fileDic['created by'].decode('utf-8')
return ''
# 多文件的情况下,得到多个文件的个数
def getFileCount(self):
return len(self.fileDic['info']['files'])
# 多文件的情况下,获得所有文件,返回为:dic
def getFiles(self):
files=[]
for item in self.fileDic['info']['files']:
file={}
for key in item.keys():
value=item.get(key)
if key=='path':
path=value[0].decode()
value=path
if key=='path.utf-8':
path=value[0].decode()
value=path
file[key]=value
files.append(file)
return files
# 单文件情况下,取文件名
def getSingleFileName(self):
#print(str(self.fileDic['info']['name']))
#return str(self.fileDic['info']['name'],'utf-8')
return self.getTitle();
# 单文件情况下,取文件长度
def getSingleFileLength(self):
return self.fileDic['info']['length']
# 单文件情况下,取文件md5sum
def getSingleFileMd5sum(self):
if 'md5sum' in self.fileDic['info']:
return str(self.fileDic['info']['md5sum'],'utf-8')
else:
return ''
# 单文件情况下,取文件长度
def getSingleFilePieceLength(self):
return self.fileDic['info']['piece length']
# 单文件情况下,取文件pieces
def getSingleFilePieces(self):
return self.fileDic['info']['pieces']
# 得到文件简报
def getBrief(self):
retval=""
retval=retval+"File:"+self.filePathname+"\n"
retval=retval+"announce:"+self.getAnnounce()+"\n"
arr=self.getAnnounceList()
if(len(arr)>0):
retval=retval+"announce list:"+"\n"
for it in arr:
retval=retval+"\t"+it+"\n"
retval=retval+"Create time:"+self.getCreateTime()+"\n"
retval=retval+"Ecoding:"+self.getEncoding()+"\n"
retval=retval+"Title:"+self.getTitle()+"\n"
retval=retval+"Comment:"+self.getComment()+"\n"
retval=retval+"Created by:"+self.getCreatedBy()+"\n"
hasMulti=self.hasMultiFiles()
retval=retval+"has multi files:"+str(hasMulti)+"\n"
if hasMulti==True:
retval=retval+"[多文件结构]"+"\n"
retval=retval+"包含文件个数为:"+str(self.getFileCount())+"\n"
retval=retval+"Files:"+"\n"
files=self.getFiles();
index=1
for item in files:
retval=retval+"\tfile#"+str(index)+"\n"
for key in item.keys():
value=item.get(key)
retval=retval+"\t\t"+str(key)+":"+str(value)+"\n"
retval=retval+"\n"
index=index+1
else:
retval=retval+"[单文件结构]"+"\n"
retval=retval+"文件名为:"+self.getSingleFileName()+"\n"
retval=retval+"文件长度:"+str(self.getSingleFileLength())+"byte\n"
retval=retval+"文件md5sum:"+self.getSingleFileMd5sum()+"\n"
retval=retval+"文件块长度:"+str(self.getSingleFilePieceLength())+"byte\n"
return retval
#-------------------------------------
# 入口
#-------------------------------------
def main():
tp=torrentParser(filePathname='./6.torrent')
print('文件名='+tp.getFilepathname())
print('文件结构:\n'+tp.getStructure())
print('文件内容:\n'+str(tp.getAllContent()))
# Start
main()
2018年5月9日11点18分
【Python】torrentParser1.02的更多相关文章
- 【Python】torrentParser1.04 增加获得磁力链URI功能
代码: #------------------------------------------------------------------------------------ # torrentP ...
- 【Python】torrentParser1.01
在昨天的版本上做了一些改进,如增加getAll,修改getSingleFileName等 代码: #-------------------------------------------------- ...
- 【Python】torrentParser1.00
代码: #------------------------------------------------------------------------------------ # torrentP ...
- 【python】insertDB1.02
#------------------------------------------------------------------------------------ # insertDB1.02 ...
- 【Python】torrentParser1.03
#------------------------------------------------------------------------------------ # torrentParse ...
- 【Python】 零碎知识积累 II
[Python] 零碎知识积累 II ■ 函数的参数默认值在函数定义时确定并保存在内存中,调用函数时不会在内存中新开辟一块空间然后用参数默认值重新赋值,而是单纯地引用这个参数原来的地址.这就带来了一个 ...
- 【python】列出http://www.cnblogs.com/xiandedanteng中所有博文的标题
代码: # 列出http://www.cnblogs.com/xiandedanteng中所有博文的标题 from bs4 import BeautifulSoup import requests u ...
- 【python】redis基本命令和基本用法详解
[python]redis基本命令和基本用法详解 来自http://www.cnblogs.com/wangtp/p/5636872.html 1.redis连接 redis-py提供两个类Redis ...
- 【Python②】python之首秀
第一个python程序 再次说明:后面所有代码均为Python 3.3.2版本(运行环境:Windows7)编写. 安装配置好python后,我们先来写第一个python程序.打开IDLE (P ...
随机推荐
- Ubuntu使用安装或者卸载软件!!!
安装软件: 1.在应用商店里面下载安装 2.在终端sudo apt-get install 软件名 3.使用ppa:加入一个ppa源:sudo add-apt-repository ppa:user/ ...
- LAMP学习路线图
站点开发概述 LAMP开发概述 HTML基础 CSS基础 DIV+CSS Javascript Jquery(Ajax) WAMP 环境搭建 PHP基本的语法,变量.数据类型,表达式,常量,流程控制, ...
- win8操作系统下使用telnet客户端
一.安装Telnet客户端 今天尝试在Win8操作系统下使用telnet客户端连接上搜狐的邮件服务器时,结果出现了'telnet' 不是内部或外部命令,也不是可运行的程序,如下图所示: 上网查了一下原 ...
- Unity3D实践系列11, 组件的添加和访问
当把一个脚本附加到一个GameObject上的时候,这个GameObject就有了脚本组件. 通过GameObject的属性获取组件 比如如下: [RequireComponent(typeof(Ri ...
- Python index()方法
Python index()方法 Python 字符串 描述 Python index() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否 ...
- linux 下查看硬盘分区类型
可以用 df 这个命令 具体 要 man df 仔细看看 实例 [root@localhost mnt]# df -Th文件系统 类型 容量 已用 可用 已用% 挂载点/dev ...
- Redis客户端集群
1.Redis集群一般分为两类,即3.0版本后的服务端集群实现,3.0版本前的客户端集群实现,服务端集群即Redis Cluster(官方实现),采用slot槽的概念(分片,所有服务端redi ...
- struct net_device网络设备结构体详解
转自:http://blog.csdn.net/viewsky11/article/details/53046787 在linux中使用struct net_device结构体来描述每一个网络设备.同 ...
- left join 注意事项
相信对于熟悉SQL的人来说,LEFT JOIN非常简单,采用的时候也很多,但是有个问题还是需要注意一下.假如一个主表M有多个从表的话A B C …..的话,并且每个表都有筛选条件,那么把筛选条件放到哪 ...
- ios之gcd浅析
A.普通的GCD异步运行与主线程更新写法: dispatch_async(dispatch_get_global_queue(DISPATCH_QUEUE_PRIORITY_DEFAULT, ), ^ ...