Python数据分析几个比较常用的方法

zhang.ning 2024-09-24 01:02:25 原文

1，表头或是excel的索引如果是中文的话，输出会出错

解决方法：python的版本问题！换成python3就自动解决了！当然也有其他的方法，这里就不再深究

2，如果有很多列，如何输出指定的列？

需求情况：有的时候，数据很多，但是只要仅仅对部分列的数据进行分析的话，要怎么做？

解决方法：

df = pandas.read_excel('1.xls',sheetname= '店铺分析日报')

df = df.loc[:,['关键词','带来的访客数','跳失率']] #访问指定的列

一行读取数据，第二行访问指定列

3，如何为数据框添加新的列？

需求情况：有一个表格，里面的列是单价，数量，想再输出一个总价的列，或是对一些数据进行总结

解决方法：直接上代码

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

#把计算结果添加为一个新的列

df['result'] = df.price*df.num #新的列名，后面是对应的数值

print (df)

4，如何对百分号的数值进行计算，再将其输出

需求情况：比较蛋疼的一个情况，电商很多数据都是百分比的，带有百分号，不能进行直接的计算，需要对其进行转换，然后再输出

解决方法：

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

f = df['跳失率'].str.strip("%").astype(float)/100;

f.round(decimals=2) #保留小数点后面2位

f_str = f.apply(lambda x: format(x, '.2%')); #再转换成百分号并且保留2位数（精度可以调整）

df['跳失率'] = f_str #重新赋值

5，如何获取导入的数据有几行和几列（数值）

需求情况：有的时候需要写一个通用脚本，比如随机抽样分析，程序自动获取行和列的话，写出来的脚本通用性明显会很强

解决方法：

df.columns.size #获取列数

df.iloc[:, 0].size #获取行数

6，如何对数据进行排序

需求情况：这个就不用说了，到处都要用到

解决方法：

df['跳失率'].size #对数据进行排序

newDF = df.sort(['曝光量', '带来的访客数'], ascending=[True, False]); #多重排序

7，如何删除指定的列？

需求情况：同样，十几列的数据，如果你想获取指定的输出数据，可以用方法2，但是如果想要获取的数据列比较多，只有1-2行不想要，这样就可以用指定删除列的方法了

解决方法：

df.columns.delete(1)

一行代码搞定！

总结：整体来说的，python的语法在做数据分析还是相当简单的，很多的需求基本上就是一行代码搞定！

8，如何添加整行数据？

df.append([1,2,34,,5])

Python数据分析几个比较常用的方法的更多相关文章

Python语言学习：列表常用的方法
python 列表常用的方法 1.append( ):用于在列表末尾添加新的对象 list.appent(obj) #obj:添加到列表末尾的对象 #!/usr/bin/python aList = ...
Python语言学习：字符串常用的方法
python字符串常用的方法 1. find( ):在字符串中搜索指定的值并返回它被找到的位置,如果没有找到,则返回-1 string.find(value,start,end) #value:必需, ...
python join 和 split的常用使用方法
函数:string.join()Python中有join()和os.path.join()两个函数,具体作用如下: join(): 连接字符串数组.将字符串.元组.列表中的元素以指定的字符 ...
python中字符串(str)的常用处理方法
str='python String function' 生成字符串变量str='python String function' 字符串长度获取:len(str)例:print '%s length= ...
python数据分析开发中的常用整理
Pandas操作 python使用pandas读取csv import pandas as pd #数据筛选 usetTable = pd.read_csv(filename,header = 0) ...
Python 基础之面向对象之常用魔术方法
一.__init__魔术属性触发时机:实例化对象,初始化的时候触发功能:为对象添加成员,用来做初始化的参数:参数不固定,至少一个self参数返回值:无 1.基本用法 #例:class MyClass ...
Python语言学习：字典常用的方法
1. 增加:字典[key]=value(不存在的key和value) info={ 'stu1101':'TengLan', 'stu1102':'LuoZe', 'stu1103':'XiaoZe' ...
python数据分析&挖掘，机器学习环境配置
目录一.什么是数据分析 1.这里引用网上的定义: 2.数据分析发展与组成 3.特点二.python数据分析环境及各类常用分析包配置 1.处理的数据类型 2.为什么选择python 三.python ...
Python数据分析与挖掘所需的Pandas常用知识
Python数据分析与挖掘所需的Pandas常用知识前言Pandas基于两种数据类型:series与dataframe.一个series是一个一维的数据类型,其中每一个元素都有一个标签.series ...

随机推荐

“指定的参数已超出有效值的范围”在【 parameterUpdate.Add(new OracleParameter("STATUS", 0));】报错
改成:parameterUpdate.Add()); 就不报错,并不能知道为什么,有知道为什么的,评论告诉我. /// <summary> /// 插入数据 /// </summar ...
css干货部分
1.css的引入方式(三种): a.行内样式<div> <p style="color: green">我是一个段落</p> </div& ...
【ARTS】01_16_左耳听风-20190225~20190303
ARTS: Algrothm: leetcode算法题目 Review: 阅读并且点评一篇英文技术文章 Tip/Techni: 学习一个技术技巧 Share: 分享一篇有观点和思考的技术文章 Algo ...
eMMC基础技术11：flash memory
[转]http://www.wowotech.net/basic_tech/367.html 0.前言 eMMC 是 Flash Memory 的一类,在详细介绍 eMMC 之前,先简单介绍一下 Fl ...
workqueue --最清晰的讲解
带你入门: 1.INIT_WORK(struct work_struct *work, void (*function)(void *), void *data) 上面一句只是定义了work和work ...
matlab处理手写识别问题
初学神经网络算法--梯度下降.反向传播.优化(交叉熵代价函数.L2规范化) 柔性最大值(softmax)还未领会其要义,之后再说有点懒,暂时不想把算法重新总结,先贴一个之前做过的反向传播的总结ppt ...
Liunx之xl2TP的一键搭建
作者:邓聪聪 1 L2TP(Layer 2 Tunnel Protocol二层隧道协议l),上图说明了VPN的一些特点,出差员工或者外出员工通过拨特定号码的方式接入到企业内部网络; --------- ...
ffmpeg-201701[10,16,21,23,25]-bin.7z
ESC 退出 0 进度条开关 1 屏幕原始大小 2 屏幕1/2大小 3 屏幕1/3大小 4 屏幕1/4大小 5 屏幕横向放大 20 像素 6 屏幕横向缩小 20 像素 S 下一帧 [ -2秒 ] +2 ...
ubuntu安装 opencv-3.4.3
1 .官网(https://opencv.org/releases.html)下载下源码 opencv-3.4.3.zip 2.解压 unzip opencv-3.4.3.zip 3.cmake c ...
MVC之基架
参考 ASP.NET MVC5 高级编程(第5版) 定义: 通过对话框生成视图及控制器的模版,这个过程叫做“基架”. 基架可以为应用程序的创建.读取.更新和删除(CRUB)功能生成所需的样板代码.基架 ...