在使用pandas 0.23.4对日期进行分组排序时报错

    date_df["rank_num"] = date_df.groupby("issuer_id").report_date.agg("rank", **{"ascending": 1, "method": "min"})

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 3479, in aggregate

    return getattr(self, func_or_funcs)(*args, **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 1906, in rank

    na_option=na_option, pct=pct, axis=axis)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 1025, in _cython_transform

    **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2630, in transform

    return self._cython_operation('transform', values, how, axis, **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2590, in _cython_operation

    **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2664, in _transform

    transform_func(result, values, comp_ids, is_datetimelike, **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2479, in wrapper

    return f(afunc, *args, **kwargs)

  File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2430, in <lambda>

    kwargs.get('na_option', 'keep')

TypeError: 'NoneType' object is not callable

在使用pandas对一列日期进行分组排序时报错，

1. 根据错误提示 File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2430, in <lambda> kwargs.get('na_option', 'keep') 可知，是因为pandas模块的groupby.py文件的下面代码中func函数传入为None导致的。

'f': lambda func, a, b, c, d, **kwargs: func(

    a, b, c, d,

    kwargs.get('ties_method', 'average'),

    kwargs.get('ascending', True),

    kwargs.get('pct', False),

    kwargs.get('na_option', 'keep')

)

2. 根据错误提示
　　File "D:\python_virtualenv\es_env\lib\site-packages\pandas\core\groupby\groupby.py", line 2478, in wrapper return f(afunc, *args, **kwargs)
　　可知afunc就是传入的函数，这个afunc是使用get_func函数一步步获取的，最终是看_libs\groupby.py文件下是否存在一个group_rank_object函数，但是文件中没有，所以获得的是None。

def _get_cython_function(self, kind, how, values, is_numeric):

# 这一步查看values中的数据类型，date无法识别，datetime识别为int

    dtype_str = values.dtype.name

    def get_func(fname):

        # see if there is a fused-type version of function

        # only valid for numeric

# 这一步看libgroupby中是不是有fname对应的函数

        f = getattr(libgroupby, fname, None)

        if f is not None and is_numeric:

            return f

        # otherwise find dtype-specific version, falling back to object

# 再看是不是有group_rank_object函数，因为没有，所以最后返回的结果是None

        for dt in [dtype_str, 'object']:

            f = getattr(libgroupby, "%s_%s" % (fname, dtype_str), None)

            if f is not None:

                return f

    ftype = self._cython_functions[kind][how]

    if isinstance(ftype, dict):

# 这一步获取传入的函数afunc

        func = afunc = get_func(ftype['name'])

        # a sub-function

        f = ftype.get('f')

        if f is not None:

            def wrapper(*args, **kwargs):

                return f(afunc, *args, **kwargs)

            # need to curry our sub-function

            func = wrapper

3.结论
　　(1).0.23.4的pandas没有对object的排序方式，只存在针对int和float的排序方式。
　　(2).0.23.4的pandas无法识别date类型，是作为object类型。但是可以识别datetime类型，会把datetime类型识别为int来处理。
　　(3).所以要对日期列进行排序，需要先转换成时间才行。

0.23版本的pandas存在这个问题，但是0.22版本没有这个问题。

在使用pandas 0.23.4对日期进行分组排序时报错的更多相关文章

pandas 0.19.0 documentation
pandas 0.19.0 documentation » http://pandas.pydata.org/pandas-docs/stable/style.html
[EXP]Apache Superset < 0.23 - Remote Code Execution
# Exploit Title: Apache Superset < 0.23 - Remote Code Execution # Date: 2018-05-17 # Exploit Auth ...
[EXP]ThinkPHP 5.0.23/5.1.31 - Remote Code Execution
# Exploit Title: ThinkPHP .x < v5.0.23,v5.1.31 Remote Code Execution # Date: -- # Exploit Author: ...
【Mysql】【Navicat For Mac】Navicat Premium for Mac v12.0.23 + macOS Sierra 10.12.6
参考地址:https://blog.csdn.net/womeng2009/article/details/79700667 [备注]我只用到了部分信息,就激活了内容: Navicat Premiu ...
resin4.0.23+nginx1.1集群
一,web服务器小论以前的公司使用的web服务器是tomcat(tomcat+apache作集群),现在的公司是一家互联网公司,采用的架构是resin+nginx作集群(resin比tomcat快? ...
ThinkPHP-5.0.23新的RCE漏洞测试和POC
TP5新RCE漏洞昨天又是周五,讨厌周五曝漏洞,还得又得加班,算了,还是先验证一波.新的TP5RCE,据说发现者因为上次的RCE,于是又审计了代码,结果发现的.TP5也成了万人轮啊. 测试环境搭建 ...
ThinkPHP 更新 5.0.23 和 5.1.31
ThinkPHP 更新 5.0.23 和 5.1.31 FastAdmin 也跟着更新. V1.0.0.20181210_beta 修复 ThinkPHP5.0发布了一个重要安全更新,强烈建议更新修 ...
Navicat Premium v12.0.23.0 破解教程x86,x64通用，手动破解
教程来源于:吾爱破解网站 ----------更新线----------- 2018.01.23 Navicat Premium v12.0.23.0 测试破解依然有效 ----------更新线-- ...
Navicat Premium v12.0.23.0 安装，使用激活码激活
1 下载可以直接官网下载安装包,也可以直接到我的云盘下载下载地址:https://pan.baidu.com/s/1apwU9cIKBTr-z0CuJEJ9gg 文件包中包含下面的文件: 2 安装 ...

随机推荐

learning svn add file execuable
svn propset svn:executable on <file> 为了给svn仓库里的问件添加可执行权限.
Codeforces Round #589 (Div. 2)
目录 Contest Info Solutions A. Distinct Digits B. Filling the Grid C. Primes and Multiplication D. Com ...
linux系列（四）：mkdir命令
1.命令格式: mkdir [选项] 目录名 2.命令功能: 通过 mkdir 命令可以实现在指定位置创建以 DirName(指定的文件名)命名的文件夹或目录.要创建文件夹或目录的用户必须对所创建的文 ...
codeforces626F
CF626F Group Projects 有n个学生,每个学生有一个能力值ai.现在要把这些学生分成一些(任意数量的)组,每一组的“不和谐度”是该组能力值最大的学生与能力值最小的学生的能力值的差. ...
vue中class用法
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
TCP/IP 这猝不及防的爱情
前言前几天看了老刘的一篇文章,TCP/IP 大明邮差.正好最近也在读<计算机自顶向下>一书心血来潮,想写一个女版的TCP/IP 正文一天,我正在百花会上赏花,赏着赏着,就出现了一个令 ...
Java--常用API介绍
Scanner类--键盘输入,室友起来三个步骤: 第一,导包:import java.util.Scanner 第二,创建:Scanner sc = new Scanner(System.in) 第三 ...
配置 Ubuntu 服务器
Python: apt install python3-pip sudo add-apt-repository ppa:fkrull/deadsnakes sudo apt-get update ap ...
Go -- this user requires mysql native password authentication 错误
this user requires mysql native password authentication 在连接mysql的url上加上?allowNativePasswords=true,这次 ...
MySQL 中视图和表的区别以及联系是什么？
两者的区别: (1)视图是已经编译好的 SQL 语句,是基于 SQL 语句的结果集的可视化的表,而表不是. (2)视图没有实际的物理记录,而基本表有. (3)表是内容,视图是窗口. (4)表占用物理空 ...

在使用pandas 0.23.4对日期进行分组排序时报错

在使用pandas 0.23.4对日期进行分组排序时报错的更多相关文章

随机推荐

热门专题