1,表头或是excel的索引如果是中文的话,输出会出错

​​解决方法:python的版本问题!换成python3就自动解决了!当然也有其他的方法,这里就不再深究

2,如果有很多列,如何输出指定的列?

需求情况:有的时候,数据很多,但是只要仅仅对部分列的数据进行分析的话,要怎么做?

解决方法

df = pandas.read_excel('1.xls',sheetname= '店铺分析日报')

​df = df.loc[:,['关键词','带来的访客数','跳失率']] #访问指定的列

一行读取数据,第二行访问指定列

3,如何为数据框添加新的列?

需求情况:有一个表格,里面的列是单价,数量,想再输出一个总价的列,或是对一些数据进行总结

解决方法:直接上代码

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

#把计算结果添加为一个新的列

df['result'] = df.price*df.num     #新的列名,后面是对应的数值

print (df)

4,如何对百分号的数值进行计算,再将其输出

需求情况:比较蛋疼的一个情况,电商很多数据都是百分比的,带有百分号,不能进行直接的计算,需要对其进行转换,然后再输出

解决方法:

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

f = df['跳失率'].str.strip("%").astype(float)/100;

f.round(decimals=2)  #保留小数点后面2位

f_str = f.apply(lambda x: format(x, '.2%'));  #再转换成百分号并且保留2位数(精度可以调整)

df['跳失率']​ = f_str     #重新赋值

5,​如何获取导入的数据有几行和几列(数值)

需求情况:有的时候需要写一个通用脚本,比如随机抽样分析,程序自动获取行和列的话,写出来的脚本通用性明显会很强

解决方法:

df.columns.size   #获取列数

df.iloc[:, 0].size  #获取行数

6,​如何对数据进行排序

需求情况:这个就不用说了,到处都要用到​

解决方法:

df['跳失率'].size   #对数据进行排序

newDF = df.sort(['曝光量', '带来的访客数'], ascending=[True, False]);  #多重排序

7,如何删除指定的列?

需求情况:同样,十几列的数据,如果你想获取指定的输出数据,可以用方法2,但是如果想要获取的数据列比较多,只有1-2行不想要,这样就可以用指定删除列的方法了

解决方法:

df.columns.delete(1)​

一行代码搞定!​

总结:整体来说的,python的语法在做数据分析还是相当简单的,很多的需求基本上就是一行代码搞定!

8,如何添加整行数据?

df.append([1,2,34,,5])

Python数据分析几个比较常用的方法的更多相关文章

  1. Python语言学习:列表常用的方法

    python 列表常用的方法 1.append( ):用于在列表末尾添加新的对象 list.appent(obj) #obj:添加到列表末尾的对象 #!/usr/bin/python aList = ...

  2. Python语言学习:字符串常用的方法

    python字符串常用的方法 1. find( ):在字符串中搜索指定的值并返回它被找到的位置,如果没有找到,则返回-1 string.find(value,start,end) #value:必需, ...

  3. python join 和 split的常用使用方法

    函数:string.join()Python中有join()和os.path.join()两个函数,具体作用如下:    join():    连接字符串数组.将字符串.元组.列表中的元素以指定的字符 ...

  4. python中字符串(str)的常用处理方法

    str='python String function' 生成字符串变量str='python String function' 字符串长度获取:len(str)例:print '%s length= ...

  5. python数据分析开发中的常用整理

    Pandas操作 python使用pandas读取csv import pandas as pd #数据筛选 usetTable = pd.read_csv(filename,header = 0) ...

  6. Python 基础之面向对象之常用魔术方法

    一.__init__魔术属性 触发时机:实例化对象,初始化的时候触发功能:为对象添加成员,用来做初始化的参数:参数不固定,至少一个self参数返回值:无 1.基本用法 #例:class MyClass ...

  7. Python语言学习:字典常用的方法

    1. 增加:字典[key]=value(不存在的key和value) info={ 'stu1101':'TengLan', 'stu1102':'LuoZe', 'stu1103':'XiaoZe' ...

  8. python数据分析&挖掘,机器学习环境配置

    目录 一.什么是数据分析 1.这里引用网上的定义: 2.数据分析发展与组成 3.特点 二.python数据分析环境及各类常用分析包配置 1.处理的数据类型 2.为什么选择python 三.python ...

  9. Python数据分析与挖掘所需的Pandas常用知识

    Python数据分析与挖掘所需的Pandas常用知识 前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...

随机推荐

  1. springboot整合JSP以及发布项目到独立的tomcat中与打成jar包使用

    之前研究了springboot整合freemarker与thymeleaf的使用.也研究了springboot发布到独立的tomcat的使用以及使用自带的tomcat打成jar包的使用,下面研究集成J ...

  2. Java的Fork/Join任务

    当我们需要执行大量的小任务时,有经验的Java开发人员都会采用线程池来高效执行这些小任务.然而,有一种任务,例如,对超过1000万个元素的数组进行排序,这种任务本身可以并发执行,但如何拆解成小任务需要 ...

  3. 将replicated数据与元数据关联

    本章介绍元数据的用法以及如何将replicated数据与元数据相关联. 12.1概述 将数据从一个表复制到另一个表时,重要的考虑因素是源表和目标表的列结构(元数据)是否相同. Oracle Golde ...

  4. [转] 多核CPU 查看进程分配的CPU具体核id

    转自:https://linux.cn/article-6307-1.html ps. 方法二简明直接 done! 当你在 多核 NUMA 处理器上运行需要较高性能的 HPC(高性能计算)程序或非常消 ...

  5. 20165325 2017-2018-2《Java程序设计》课程总结

    20165325 2017-2018-2<Java程序设计>课程总结 一.每周作业链接汇总 1.预备作业一:我期待的师生关系 20165325 期望的师生关系 简要内容: 我心中的好老师 ...

  6. python 中@ 的用法【转】

    这只是我的个人理解: 在Python的函数中偶尔会看到函数定义的上一行有@functionName的修饰,当解释器读到@的这样的修饰符之后,会先解析@后的内容,直接就把@下一行的函数或者类作为@后边的 ...

  7. Python os.walk文件遍历用法【转】

    python中os.walk是一个简单易用的文件.目录遍历器,可以帮助我们高效的处理文件.目录方面的事情. 1.载入 要使用os.walk,首先要载入该函数 可以使用以下两种方法 import os ...

  8. python打印朱莉娅集合

    # -*- coding: utf-8 -*- import numpy as np import matplotlib.pyplot as plt # 複素数列の計算回数を出力する関数loopmax ...

  9. 题解-CTSC2012 熟悉的文章

    Problem bzoj 题目大意:给定多个标准串和一个文本串,全部为01串,如果一个串长度不少于\(L\)且是任意一个标准串的子串,那么它是"熟悉"的.对于文本串\(A\),把\ ...

  10. maven项目导入war包

    导入war包,使用war包中的类和静态资源(css,js,包含jsp等) A项目是被导入的war工程,B项目是需要A项目的一个工程. 在<build>中 <resources> ...