怎样解决python dataframe loc，iloc循环处理速度很慢的问题

1.问题说明

最近用DataFrame做大数据处理，发现处理速度特别慢，追究原因，发现是循环处理时，loc，iloc速度都特别慢，当数据量特别大得时候真的是超级慢。查很多资料，发现没有详细说明，以下为解决办法

2.问题解决

使用 Pandas.Series.apply 方法，可以对一列数据快速进行处理

Series.apply(*func*, *convert_dtype=True*, *args=()*, **\*kwds*)

函数说明：

To lunch typora from Terminal, you could add

func : function

convert_dtype : boolean, default True

    Try to find better dtype for elementwise function results. If False, leave as dtype=object

args : tuple

    Positional arguments to pass to function in addition to the value

Additional keyword arguments will be passed as keywords to the function

例子讲解

# 首先导入数据

>>> import pandas as pd

>>> import numpy as np

>>> series = pd.Series([20, 21, 12], index=['London','New York','Helsinki'])

>>> series

London      20

New York    21

Helsinki    12

dtype: int64

# 应用1，把每个值都*2

>>> def square(x):

...     return x**2

>>> series.apply(square)

London      400

New York    441

Helsinki    144

dtype: int64

>>> series.apply(lambda x: x**2)

London      400

New York    441

Helsinki    144

dtype: int64

# 应用2，相减

>>> def subtract_custom_value(x, custom_value):

...     return x-custom_value

>>> series.apply(subtract_custom_value, args=(5,))

London      15

New York    16

Helsinki     7

dtype: int64

# 使用numpy library中得函数

>>> series.apply(np.log)

London      2.995732

New York    3.044522

Helsinki    2.484907

dtype: float64

3.总结

这样可以快速操作一列数据，不必循环操作每行每列数据，对于大数据处理是非常有用的

怎样解决python dataframe loc，iloc循环处理速度很慢的问题的更多相关文章

(原)怎样解决python dataframe loc，iloc循环处理速度很慢的问题
怎样解决python dataframe loc,iloc循环处理速度很慢的问题 1.问题说明最近用DataFrame做大数据处理,发现处理速度特别慢,追究原因,发现是循环处理时,loc,iloc ...
Python: 对于DataFrame.loc传入列表和传入元组输出区别的理解
def test(): import pandas as pd tuples = [ ('cobra', 'mark i'), ('cobra', 'mark ii'), ('sidewinder', ...
关于解决python线上问题的几种有效技术
工作后好久没上博客园了,虽然不是很忙,但也没学生时代闲了.今天上博客园,发现好多的文章都是年终总结,想想是不是自己也应该总结下,不过现在还没想好,等想好了再写吧.今天写写自己在工作后用到的技术干货,争 ...
Python流程控制-while循环-for循环
写重复代码是可耻的行为 -------------- 完美的分割线 -------------- 摘录自:http://www.runoob.com/python/python-loops.htm ...
转：解决Python中文编码问题
Python 文本挖掘:解决Python中文编码问题转于:http://rzcoding.blog.163.com/blog/static/2222810172013101785738166/ ...
Python Dataframe 分组排序和 Modin
Python Dataframe 分组排序和 Modin 1.按照其中一列进行排序在dataframe中,按照其中的一列排序:比如q值倒排 (1)rank方法 data['new_rank'] = ...
Pandas：loc iloc ix用法
参考:Pandas中关于 loc \ iloc \ ix 用法的理解相同点使用形式都是 df.xxx[ para1 , para2 ] #xxx表示loc iloc ix#df表示一个DataFr ...
paip.日志中文编码原理问题本质解决python
paip.日志中文编码原理问题本质解决python 默认的python日志编码仅仅gbk...保存utf8字符错误..输出到个eric5的控制台十默认好像十unicode的,要是有没显示出来的字符,大 ...
Python之 continue继续循环和多重循环
Python之 continue继续循环在循环过程中,可以用break退出当前循环,还可以用continue跳过后续循环代码,继续下一次循环. 假设我们已经写好了利用for循环计算平均分的代码: L ...

随机推荐

c头文件(.h)的作用
C语言的著作中,至今还没发现把.h文件的用法写的透彻的.在实际应用中也只能依葫芦画瓢,只知其然不知其所以然,甚是郁闷!闲来无事,便将搜集网络的相关内容整理一下,以便加深自己的理解理论概述:.h中一般 ...
IT咨询服务-客户案例(四)：根据图片等素材，动态生成个性化图片
最近,慕名而来一个客户. 客户的目标网站来一个用户,选择模版,上传图片等素材,生成自定义的图片,或者静态网站,然后分享到社交网站.有点类似于,网上制作名片,选择模版,输入个人信息,生成名片的设 ...
【t054】糟糕的网络
Time Limit: 1 second Memory Limit: 128 MB [问题描述] 前几天sqybi 还在高高兴兴的用BOINC 完成着一个又一个的任务呢,但现在sqybi 突然变得闷闷 ...
Python科学计算（一）
一.准备教材:<python科学计算> 作者: 张若愚出版社: 清华大学出版社出版年: 2012-1 页数: 621 定价: 98.00元装帧: 平装 ISBN: 97873022 ...
苹果抛弃的芯片公司Imagination被中资49亿溢价收购
原标题:中国资本Canyon Bridge出资5.5亿英镑收购Imagination芯片来源:观察者网对于一家手机硬件公司来说,被苹果看上可谓是“一夜之间,鸡犬升天”.但是如果被苹果抛弃了呢?那可 ...
ES6与React中this完全解惑
计划写很长的篇幅,预计12月初完成. 这篇文章涉及的知识较多,可能一次消化不了,可以渐渐来. 先说结论: 无论是ES6还是React的this,相对于ES5,只是增加了箭头函数this绑定了其封闭上下 ...
Android Studio入门（安装-->开发调试）
写在前面的话:本文来源:http://blog.csdn.net/yanbober/article/details/45306483 目标:Android Studio新手–>下载安装配置–&g ...
Java带参数的线程类ParameterizedThread——即如何给Thread传递参数
在Java中似乎没有提供带运行参数的线程实现类,在第三方类库中也没有找到.网上有大量的文章在讨论这个问题,但都没有提供很好的代码封装解决方案,这令我很吃惊.如果读者知道有官方或者第三方的实现方式,欢迎 ...
shp数据和tab数据的两点区别
作者:朱金灿来源:http://blog.csdn.net/clever101 shp是ArcGIS的矢量格式,tab是Mapinfo的矢量格式.shp数据和tab数据有两点区别:一是shp数据的f ...
less - 循环 loop
.avatar-loop(@n, @i:1, @level) when (@i <= @n) { &:nth-child(@{level}) .item.item-@{i} { .ava ...

怎样解决python dataframe loc，iloc循环处理速度很慢的问题

怎样解决python dataframe loc，iloc循环处理速度很慢的问题

1.问题说明

2.问题解决

3.总结

怎样解决python dataframe loc，iloc循环处理速度很慢的问题的更多相关文章

随机推荐

热门专题