ipython notebook

命令行输入ipython notebook

此时,浏览器会自动运行并打开ipython网页

基本操作

如上图所示,新建一个项目

导入相关模块,建立一个数据集

制造数据缺失项,并给新插入部分部分赋值

这样就构造了一个二维的DataFrame数组,其中包含了一些空数据

处理空数据一般有两种

  dropna(),将含有空值行去掉

  fillna(values=5)将空值替换成默认值

pd.isnull(df1) 可以判断元素是否是空数据,加any().any()可以得到是否有空数据的布尔值

按列求平均值计算:(空值不参与计算)

按行求平均值计算:(空值不参与计算)

按列求累加值:(空值不参与计算)

当两个维数不同的数组相减时,被减的数组会复制当前列补全被减数组的维数,空值不参与运算

按行累加

每一列最大值减最小值

apply函数输入的是个序列

value_counts()查看元素出现的次数与.mode()查看出现次数最多的元素

先创建一个随机序列

调用value_counts()

调用.mode()查看出现次数最多的元素

数据合并

先创建一个10*4的数组

(1)调用concat()函数合并数组(concat接受的是一个数组,数组里面是要合并的数组)

查看合并后的数组是否与原数组相等

(2)通过merge合并,类似于表join关联

先创建两个数组

调用merge,等价于select * from left inner join right on left.key = right.key;

(3)插入方式合并数组

先创建一个数组

调用append,如果插入列数不同,将为缺失值

分类统计

先创建数组

单个对'A‘’分组,groupby('A')

多分组,groupby([])

数据整形

  概括:行索引与列索引做位置互换

  先创建一个元组列表

  给双层索引重新命名

  创建一个8*2的数组

  调用stack()函数将列索引变行索引,

  调用unstack()将最后一层行索引转换为列索引,每调用一次,取一层行索引转换为列索引

数据透视

  概念:根据需求只看数组中的一部分

  先创建一个数组

  调用pivot_table(),参数为values、index、columns,分别表示要查看的列数据与行索引与列索引范围

  比如查看D这一列,以A、B为联合行索引,以C为列索引的数据,如果对应数据不存在则为NaN,如果对应位置有多个值,则为平均值

时间序列

  先创建时间序列

  根据时间序列创建对应的随机数数组

  数据量过大时可以定义采样方法,调用resample()函数

  如没两分钟采样求平均值

  还有一种创建时间序列的方式:以季度创建

  调用to_timestamp()可以转换为时间日期的格式

  pandas对于时间的计算相当简单,如

类别数据

  先创建一个数组

  添加类别数据

  查看类别索引,并给类别索引重新赋值,如果对grade排序,并不是以grade排序,而是以raw_grade来排序

数据可视化

  先创建一个数组

  调用cumsum函数对数据求和

  调用plot(),将数据可视化

数据读写

  先创建一个数组

  调用to_csv('file.csv')将数据写入磁盘

  调用pd.read_csv('file.csv')读出磁盘文件数据,加参数指定索引列,否则之前的索引列会被当成数据列产生异常

pandas网页操作基础的更多相关文章

  1. [SQL]SQL语言入门级教材_SQL数据操作基础(二)

    SQL数据操作基础(初级) netnova 于 -- :: 加贴在 数据库探讨: 为了建立交互站点,你需要使用数据库来存储来自访问者的信息.例如,你要建立一个职业介绍服务的站点,你就需要存储诸如个人简 ...

  2. 爬虫基础---HTTP协议理解、网页的基础知识、爬虫的基本原理

    一.HTTP协议的理解 URL和URI 在学习HTTP之前我们需要了解一下URL.URI(精确的说明某资源的位置以及如果去访问它) URL:Universal Resource Locator 统一资 ...

  3. Pandas 常见操作详解

    Pandas 常见操作详解 很多人有误解,总以为Pandas跟熊猫有点关系,跟gui叔创建Python一样觉得Pandas是某某奇葩程序员喜欢熊猫就以此命名,简单介绍一下,Pandas的命名来自于面板 ...

  4. pandas高级操作

    pandas高级操作 import numpy as np import pandas as pd from pandas import DataFrame,Series 替换操作 替换操作可以同步作 ...

  5. 【软件编程】乐易贵宾VIP教程 - JS改写+网页操作系列教程

    JS改写系列教程: 1.MD5加密改写教程(爱拍网登录)2.解密如何快速找到真确的js加密算法3.多重MD5加密改写教程(5173登录)4.DZ论坛登录加密改写5.唯品会手机登录加密改写6.新浪微博密 ...

  6. 安装Linux系统,学习Linux操作基础

    20189230杨静怡 2018-2019-2 <移动平台开发实践>第1周学习总结 安装Linux系统内容总结 一.学习"基于VirtualBox虚拟机安装Ubuntu图文教程& ...

  7. pandas数据操作

    pandas数据操作 字符串方法 Series对象在其str属性中配备了一组字符串处理方法,可以很容易的应用到数组中的每个元素 t = pd.Series(['a_b_c_d','c_d_e',np. ...

  8. VIM操作基础命令

    VIM操作基础命令 1 文件操作 1.1 打开文件 VIM 使用 –o 或 –O 选项打开多个文件,其中 –o 表示垂直并排,例如 vim -o lesson4 lesson5 lesson6.大O表 ...

  9. WebBrowser网页操作之提取获取元素和标签(完整篇)

    最近使用WebBrower做了几个Hook小程序,收集积累如下: using System; using System.Collections.Generic; using System.Linq; ...

随机推荐

  1. JVM 内部原理(一)— 概述

    JVM 内部原理(一)- 概述 介绍 版本:Java SE 7 图中显示组件将会从两个方面分别解释.第一部分涵盖线程独有的组件,第二部分涵盖独立于线程的组件(即线程共享组件). 目录 线程独享(Thr ...

  2. Jacky扯淡系列 – 验证码

    1 验证码的用途 防止恶意用户的csrf,比如一些bot的重复请求,类似的有密码破解等操作. 但是验证码这个东西会降低用户的体验度,因此不能将其作为必备的防护措施. 2 常见的验证码形式 通常的验证码 ...

  3. Zookeeper系列二:分布式架构详解、分布式技术详解、分布式事务

    一.分布式架构详解 1.分布式发展历程 1.1 单点集中式 特点:App.DB.FileServer都部署在一台机器上.并且访问请求量较少 1.2  应用服务和数据服务拆分  特点:App.DB.Fi ...

  4. OpenGL 太阳系行星拾取例子(GL_SELECT) VS2008 + glut实现

    太阳系:Solar System 以太阳(Sun)为中心,由内到外分别是: 水星(Mercury) 金星(Venus) 地球(Earth) 火星(Mars) 木星(Jupiter) 土星(Saturn ...

  5. [CNN] Tool - Deep Visualization

    From: http://www.infoq.com/cn/news/2016/12/depth-neural-network-fake-photos 当时大部分的DNN在识别图像中对象的过程中主要依 ...

  6. [Algorithm] Maximum Flow

    Ref MIT: lecture-13-incremental-improvement-max-flow-min-cut/ Ford Fulkerson algorithm for finding m ...

  7. iOS开发之--宏定义与const的区别及使用方法

    宏定义的常见用法: 定义一段代码,或指定字符串抽成宏. const(常量): 当有字符串常量的时候,苹果推荐我们使用const,苹果经常把常用的字符串定义成const 宏定义与const的区别: 编译 ...

  8. 一篇文章带你看懂Cloudflare信息泄露事件

    版权声明:本文由贺嘉  原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/753847001488039974 来源:腾云阁  ...

  9. 如何用Baas快速在腾讯云上开发小程序-系列3 :实现腾讯云COS API调用

    版权声明:本文由贺嘉 原创文章,转载请注明出处: 文章原文链接:https://www.qcloud.com/community/article/640268001487425627 来源:腾云阁 h ...

  10. (ecj)Eclipse的Java编译器分析之一——ecj介绍

    Java是一个开放的平台,对于除发布编译器/解释器/基础类库之外,该语言的负责机构更多的是制定一系列标准,任何符合标准的厂商产品均可用于市场投放.甚至包括其编译器及解释器. (比如Hibernate提 ...