pandas官方网址 : http://pandas.pydata.org/ 。

pandas的安装比较复杂,如果想开箱即用,可以考虑下载WinPython。WinPython的官方地址是: http://winpython.github.io/ 。

   pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包,类似于 Numpy 的核心是 ndarray,pandas 也是围绕着 Series 和 DataFrame 两个核心数据结构展开的 。Series 和 DataFrame 分别对应于一维的序列和二维的表结构。pandas 约定俗成的导入方法如下:

from pandas import Series,DataFrame
import pandas as pd

一 开发工具

jupyter notebook是升级版的IPython,可以把代码、运行结果保存在一个notebook中。
1 使用pip命令安装.jupyter notebook
$ pip install jupyter
如果没有安装报Read Timeout异常,是因为Python默认使用的是https://pypi.python.org/pypi这里的python库,通常从国内连接国外的服务器是导致超时的原因,可以设置成国内的pypi镜像站点。k
比如豆瓣, https://pypi.douban.com/simple , 然后在命令行中添加 -i,pypi镜像参数。可以使用如下命令从豆瓣下载最新的python第三方库, 如果安装jupyter模块失败,可以先删除掉以安装的jupyter模块,在重新安装。
$ pip uninstall jupyter
$ pip install jupyter -i https://pypi.douban.com/simple
2 运行 jupyter notebook
在控制台输入以下命令,运行jupyter notebook.
$ jupyter notebook
然后浏览器会自动运行,打开一个新的网页,说明jupyter notebook运行成功了。
图-jupyter notebook
3,新建python文件
在jupyer右上角New 下拉框中选择当前Python环境的解释器,在笔者的机器是Python3,选中后会弹出一个新的网页。
在网格(cell)中,输入python代码,然后输入 ctrl + Enter执行python脚本。如下图所示。
图-jupyter运行python脚本
 
jupyter的常用快捷键
  • 执行当前cell,并自动跳到下一个cell:Shift Enter
  • 执行当前cell,执行后不自动调转到下一个cell:Ctrl-Enter
  • 是当前的cell进入编辑模式:Enter
  • 退出当前cell的编辑模式:Esc
  • 删除当前的cell:双D

二 Pandas的数据结构

  Pandas中有2种主要的数据结构: Series和DataFrame,它们为大多数应用提供了一种可靠的,易于使用的基础。

三  Pandas操作文件

1 读取文件到pandas

import pandas as pd
users= pd.read_table('e:/movieusers.txt' )
print( users)

  返回结果:

          ||M|technician|
||F|other|
||M|writer|
||M|technician|

2 读取文件,或略分隔符。

from pandas import Series,DataFrame
import pandas as pd users= pd.read_table('e:/movieusers.txt' , sep='|' )
print( users)

  返回结果:

           M     technician
F other
M writer
M technician

3 读取文件,或略表头

from pandas import Series,DataFrame
import pandas as pd user_cols=['user_id' , 'age', 'gender' , 'occupation' , 'zip_code'      ]
users= pd.read_table('e:/movieusers.txt' , sep='|' , header=None , names=user_cols )
print( users)

  返回结果:

     user_id  age gender     occupation zip_code
0          1   24      M     technician    85711
1          2   53      F          other    94043
2          3   23      M         writer    32067

三 pandas写入csv文件

import pandas as pd
a = ['one','two','three']
b = [,,]
english_column = pd.Series(a, name='english')
number_column = pd.Series(b, name='number')
predictions = pd.concat([english_column, number_column], axis=)
#another way to handle
save = pd.DataFrame({'english':a,'number':b})
save.to_csv('b.txt',index=False,sep='')

参考资料:

http://www.cnblogs.com/chaosimple/p/4153083.html

http://www.open-open.com/lib/view/open1402477162868.html

Python学习总结 05 pandas的更多相关文章

  1. Python学习教程:Pandas中第二好用的函数

    从网上看到一篇好的文章是关于如何学习python数据分析的迫不及待想要分享给大家,大家也可以点链接看原博客.希望对大家的学习有帮助. 本次的Python学习教程是关于Python数据分析实战基础相关内 ...

  2. 【Python学习笔记】Pandas库之DataFrame

    1 简介 DataFrame是Python中Pandas库中的一种数据结构,它类似excel,是一种二维表. 或许说它可能有点像matlab的矩阵,但是matlab的矩阵只能放数值型值(当然matla ...

  3. 吴裕雄--天生自然python学习笔记:pandas模块强大的数据处理套件

    用 Python 进行数据分析处理,其中最炫酷的就属 Pa ndas 套件了 . 比如,如果我 们通过 Requests 及 Beautifulsoup 来抓取网页中的表格数据 , 需要进行较复 杂的 ...

  4. python学习笔记05:贪吃蛇游戏代码

    贪吃蛇游戏截图: 首先安装pygame,可以使用pip安装pygame: pip install pygame 运行以下代码即可: #!/usr/bin/env python import pygam ...

  5. 【Python学习】解决pandas中打印DataFrame行列显示不全的问题

    在使用pandas的DataFrame打印时,如果表太长或者太宽会自动只给前后一些行列,但有时候因为一些需要,可能想看到所有的行列. 所以只需要加一下的代码就行了. #显示所有列 pd.set_opt ...

  6. 吴裕雄--天生自然python学习笔记:pandas模块导入数据

    有时候,手工生成 Pandas 的 DataFrame 数据是件非常麻烦的事情,所以我们通 常会先把数据保存在 Excel 或数据库中,然后再把数据导入 Pandas . 另 一种情况是抓 取网页中成 ...

  7. 吴裕雄--天生自然python学习笔记:pandas模块删除 DataFrame 数据

    Pandas 通过 drop 函数删除 DataFrarne 数据,语法为: 例如,删除陈聪明(行标题)的成绩: import pandas as pd datas = [[65,92,78,83,7 ...

  8. 吴裕雄--天生自然python学习笔记:pandas模块DataFrame 数据的修改及排序

    import pandas as pd datas = [[65,92,78,83,70], [90,72,76,93,56], [81,85,91,89,77], [79,53,47,94,80]] ...

  9. 吴裕雄--天生自然python学习笔记:pandas模块用 dataframe.loc 通过行、列标题读取数据

    用 df.va lue s 读取数据的前提是必须知道学生及科目的位置,非常麻烦 . 而 df.loc 可直接通过行.列标题读取数据,使用起来更为方便 . 使用 df.loc 的语法为: 行标题或列标题 ...

随机推荐

  1. “一切都是消息”--iMSF(即时消息服务框架)之【请求-响应】模式(点对点)

    MSF的名字是 Message Service Framework 的简称,由于目前框架主要功能在于处理即时(immediately)消息,所以iMSF就是 immediately Message S ...

  2. MySQL高可用方案--MHA部署及故障转移

    架构设计及必要配置 主机环境 IP                 主机名             担任角色 192.168.192.128  node_master    MySQL-Master| ...

  3. loadrunner 场景设计-手工场景方案(Schedule)设计

    场景设计-手工场景方案(Schedule)设计 by:授客 QQ:1033553122 A.   定义方案schedule 在 Scenario Schedule面板中,选择一个方案schedule, ...

  4. Android开发常用的一些功能列表(转)

    文章来源:http://www.cnblogs.com/netsql/archive/2013/03/02/2939828.html 1.软件自动更新下载,并提示 2.软件登录注册,以及状态保存 3. ...

  5. sass @function,@for,@mixin 的应用

    项目前提: 不同的汽车显示不同的图片,一共9种汽车:每种汽车显示不同状态的图片,一共6种状态,所以一共会有54张图片 后台接口返回汽车种类分别为:1-9,汽车状态分别为:0-5 项目需求: 根据后台返 ...

  6. 【公众号系列】在SAP里查看条件记录的方法

    公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[公众号系列]在SAP里查看条件记录的方法   ...

  7. mysql常用赋权命令

    GRANT 所需权限 ON 库名.表名 TO '账号'@'允许访问的IP地址'; 把中文按需替换掉 所需权限:select.insert.delete.update按需要来. 上面那个允许访问IP ' ...

  8. 3.6Python数据处理篇之Numpy系列(六)---Numpy随机函数

    目录 目录 前言 (一)基础的随机函数 (二)轴的随机函数 (三)概率的随机函数 目录 前言 前一段日子学了numpy,觉得无趣,没有学完,不过后来看了看matplotlib,sympy等库时,频频用 ...

  9. tkinter学习系列(二)之窗口的设置

    目录 (一)窗体的最小框架 1.说明: 2.源代码: 3.实现效果: (二)窗体的基本设置 1.说明: 2.完整代码: 3.实现效果: (三)窗体的外形设置 1.说明: 2.完整代码: 3.实现效果: ...

  10. python基础 - 字符串作

    split(sep=None, maxsplip=-1) 从左到右 sep 指定分隔字符串,缺省情况下空白字符串,指定的字符串会被切掉 maxsplit 指定分隔次数,-1 表示遍历 rsplit(s ...