pandas从0.15版开始提供分类数据类型,用于表示统计学里有限且唯一性数据集,例如描述个人信息的性别一般就男和女两个数据常用'm'和'f'来描述,有时也能对应编码映射为0和1.血型A.B.O和AB型等选择可以映射为0.1.2.3这四个数字分别代表各个血型.pandas里直接就有categorical类型,可以有效地对数据进行分组进行相应的汇总统计工作. 当DataFrame的某列(字段)上的数据值是都是某有限个数值的集合里的值的时候,例如:性别就男和女,有限且唯一.这列可以采用Categor…