"利用python进行数据分析"学习记录 --day01 08/02 与书相关的资料在 http://github.com/wesm/pydata-book pandas 的2名字来源是 pannel data 安装python的包 conda install package_name pip install package_name 更新python的包 conda update package_name pip install --upgraade package_name 我觉得…
利用Python操作excel表格之openyxl介绍 by:授客 QQ:1033553122 欢迎加入全国软件测试交流qq群(群号:7156436) ## 绘图 c = LineChart()               # 设置图标类型:LineChart 连线图  AreaChart 面积图 c.title = 'CPU利用率'        # 设置生成图的报告名称 c.style = 10                  # 设置图例样式 c.y_axis.title = '百分比'…
利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://bbs.51testing.com/forum.php”中特定url,通过分析发现,目标url同其它url的关系如下   目标url存在子页面中的文章中,随机分布,我们要把它找出来 python脚本 #!/usr/bin/env python # -*- coding:utf-8 -*- from urllib.request…
利用Python编写简单网络爬虫实例2 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站“http://www.51testing.com/html/index.html”中特定url,通过分析发现,目标url同其它url的关系如下   目标url存在子页面中的文章中,随机分布,我们要把它找出来 python脚本 #!/usr/bin/env python # -*- coding:utf-8 -*- from urllib.r…
利用Python操作excel表格之openyxl介绍 by:授客 QQ:1033553122 欢迎加入全国软件测试交流qq群(群号:7156436),免费获取以下性能监控工具(类似Nmon精简版) 实验环境 python 3.4.0 penpyxl-2.5.3-py3.4 网盘下载地址: 下载地址:https://pan.baidu.com/s/1RC6O7tKavz8ffPgPOJ4jdg 下载地址:https://bitbucket.org/openpyxl/openpyxl/downlo…
利用Python操作excel表格之xlwt介绍   by:授客 QQ:1033553122 直接上代码   案例1 #!/usr/bin/env python # -*- coding:utf-8 -*-   __author__ = 'shouke'   import xlwt   if __name__ == '__main__':     work_book = xlwt.Workbook()     sheet1 = work_book.add_sheet('sheet1') # 添加…
有时执行dos命令需要保存返回值 需要导入库subprocess import subprocess p = subprocess.Popen('ping www.baidu.com', shell=True, stdout=subprocess.PIPE) out, err = p.communicate() print out.splitlines()[24:27] for line in out.splitlines(): print line splitlines 是个列表 可以切片操作…
-----15:18 2016/10/14----- 1. import numpy as np;import pandas as pd values = pd.Series(np.random.normal(0,1,size=2000)) #Series可看作一个定长的有序字典. 高斯分布对应的概率密度函数对应于numpy中: np.random.normal(loc=mu, scale=sigma, size=Non) 标准的正态分布(mu=0,sigma=1) np.random.norm…
在机器学习中,选择合适的算法固然重要,但是数据的处理也同样重要.通过对数据的处理,能提高计算效率,提高预测识别精确度等等 以下记录下一些数据处理的方法 一.处理缺失值 对于数据集中有缺失值的,粗暴的方法是直接删除该行或者该列的数据,但是这样不可取.可以通过计算每一列或者每一行的平均值来替代该值. from sklearn.preprocessing import Imputer import pandas as pd df = pd.read_csv(data_dir) imr = Impute…
鸭子协议(忽略对象真正类型,转而关注对象有没有实现所需的方法,签名和语义) 标准库中的抽象基类 collections.abc模块中的抽象基类 抽象方法是抽象基类中用来强制子类必须实现的方法,如果子类不实现该方法,则会报错 上述例子中的load,pick属于抽象方法,Tombola的子类必须实现这两个方法,否则报错 实际上,抽象基类的定义需要对python有深入的了解,一般来说只需要能够理解看懂源码即可. 抽象基类的句法详解…